_____________
À partir de textes produits par Marie-Renée VERSPIEREN, Maître de conférences en Sciences de l'Education, Université de Lille I pour les Actes de Lecture.
- Université de Caen, Centre d'Étude et de Recherche en Sciences de l'Éducation, École Doctorale Littérature, Cultures et Sciences Sociales, U.F.R. des Sciences de l'Homme
Étude statistique sur un échantillon d'enfants
de onze ans
- Mémoire présenté en vue de l'obtention du diplôme d'études approfondies en Sciences de l'Éducation, par Denis FOUCAMBERT, sous la direction de Monsieur le Professeur Paul CLERC, 1997.
Introduction *
Chapitre 1 : Cadres théoriques et expérimentaux. *
Chapitre 2 : Empans et silhouettes de mots : une vue statistique sur le lexique français des mots de dix lettres *
Chapitre 3 : Hypothèses et Méthodologie *
Chapitre 4 : La population expérimentale *
Chapitre 5 : Huit épreuves graphiques hors d'une situation de lecture. *
Chapitre 6 : Des épreuves aux compétences techniques *
Chapitre 7 : Rapports entre compétences techniques et performances de lecture *
Perspectives *
Bibliographie *
Introduction
Cette recherche s'inscrit dans un suivi de cohorte, entamé par l'Institut National de la Recherche Pédagogique en mai 1990. Cette longue observation de 76 enfants, de 1990 à 1993, a déjà donné lieu à différentes publications, dont en particulier une thèse de doctorat en Sciences de l'Éducation (GOIGOUX, 1993) et un rapport de recherche de l'INRP/AFL (FOUCAMBERT, CHENOUF, VIOLET, GOIGOUX, 1994/95). La première étude longitudinale d'une durée de trois ans avait pour objectif d'étudier une question complètement ignorée des recherches classiques : "comment les enfants apprennent-ils à lire lorsque l'enseignement dont ils bénéficient ne repose pas sur l'acquisition préalable des règles de correspondance grapho-phonologique ?" (GOIGOUX, 1993). Les deux études citées étudient les conceptions psychologiques, les présupposés didactiques, les organisations pédagogiques, les capacités des enfants apprentis lecteurs, dans différents schémas d'apprentissage de la langue écrite.
Trois ans après la fin de cette première recherche, et juste avant que ces élèves ne se dispersent dans différents collèges, il aurait été dommage de ne pas regarder une dernière fois leurs performances en lecture, à la fin de l'école primaire. C'est ce que l'Association Française pour la Lecture et l'INRP ont décidé d'entreprendre durant l'année scolaire 1994/95. Travaillant à l'AFL, je me suis joint au groupe d'enseignants et de chercheurs qui s'est réuni à plusieurs reprises pour mettre au point les épreuves d'évaluation de ces enfants de 11 ans. J'ai donc participé à la définition des épreuves, puis ai réalisé les programmes informatiques sur lesquels les élèves ont directement travaillé, enfin je suis allé faire passer les épreuves (juin 1995) aux enfants des sites géographiques choisis.
L'objectif initial de cette recherche était de mesurer (six ans après) les effets à long terme des méthodes d'enseignement de la lecture. Ces résultats seront publiés par l'INRP. Nous n'entrerons pas dans ce type de débat.
J'ai utilisé les données recueillies sur cette cohorte d'enfants déjà constituée, pour essayer d'étudier d'autres phénomènes. Avant d'entreprendre ce travail, j'avais pris connaissance de travaux portant sur l'étude des actions, des gestes, et des fonctionnements cérébraux à l'œuvre dans l'acte de lecture. J'avais été frappé par le peu de cas que l'on y faisait de l'entité lecteur : on choisissait des personnes sans préciser leur niveau exact de lecture, alors qu'il est pour le moins probable que de grandes différences individuelles existent dans ce domaine. Il est ainsi vraisemblable que deux lecteurs dont la vitesse de lecture peut varier de 1 à 10 n'auront pas des déplacements oculaires identiques sur un texte simple ; ou que la connaissance du système graphique de la langue écrite va modifier la façon dont on va l'appréhender. Notre groupe avait donc mis au point des épreuves afin de partir sur la piste d'une éventuelle conscience graphique. Cette expression s'est dans un premier temps construite en liaison avec le concept de conscience phonologique (SPRENGER-CHAROLLES, 1991) dont nombre de travaux suggèrent qu'elle jouerait un rôle dans l'apprentissage de la lecture. On sait, par ailleurs, que les bons lecteurs utilisent une voie dite "orthographique" (FAYOL, 1992), qui traite directement l'information écrite. On peut se demander si ce traitement ne génère pas (et/ou ne prend pas appui sur) une expérience spécifique du fonctionnement de l'écrit, dans ses unités, leur fréquence, leur combinaison, bref dans la manière dont ils constituent un système directement utilisable et qui ferait le pendant pour l'écrit de ce que chacun s'accorde à identifier pour l'oral sous le terme de conscience phonologique. Nous l'avons appelé conscience graphique dans la mesure où ses unités doivent a priori concerner tout ce que l'œil est susceptible d'utiliser dans un texte au cours d'une lecture. J'ai donc décidé d'explorer un peu plus cette notion en cherchant s'il existait, d'une part, des compétences graphiques et si, d'aute part, elles entretenaient des liens avec la performance de lecture.
Nous emploierons les termes de compétence et de performance malgré les débats qui entourent leur usage par la grammaire générative. Du côté des compétences techniques, il s'agit pour nous d'identifier des savoir-faire qui interviennent dans (à l'occasion d') un traitement de l'écrit. Il n'est le plus souvent possible d'isoler ces savoir-faire que dans des situations artificielles où le sujet n'est manifestement pas en train de lire, au sens où il serait dans un rapport complexe à un texte écrit, c'est-à-dire produit par un travail d'écriture. C'est le cas des situations habituelles de laboratoire : identification de mots isolés, prononciation de trigrammes, traitement des anaphores, etc. dont il est toujours à craindre que leur exploitation prétende élucider ce qui se passe au cours de la lecture alors qu'elles ne dévoilent que ce qui est techniquement nécessaire pour les résoudre. Du côté de la performance, il s'agit pour nous de cerner la lecture, non à travers l'addition des savoir-faire qu'on supposerait nécessaires à son déroulement mais à travers l'évaluation du niveau de réussite à des situations sur lesquelles il y a accord pour dire qu'un lecteur doit les réussir. La lecture, c'est alors ce que réussit à faire un lecteur. Et il est plus facile de décider s'il le fait efficacement et dans quelles circonstances il le fait que de savoir comment il le fait. Dès lors, il devient possible de mettre en relation une performance de lecture évaluée sur des lecteurs dans des situations de lecture et des compétences techniques exercées par ces mêmes lecteurs lorsqu'ils ont à résoudre un problème mettant en jeu de l'écrit dans une situation expérimentale.
On peut espérer ainsi moins mal cerner ce qu'est le processus de lecture en recensant déjà les compétences techniques qui y contribuent. Pour aborder cette mise en rapport entre performances de lecture et compétences techniques dans l'écrit, on serait tenté de dire compétences graphiques, il nous faudra expliciter des concepts empruntés à plusieurs disciplines et notamment à la psychologie expérimentale, à la neurophysiologie, ou encore à l'ophtalmologie. Ces références théoriques seront construites dans le premier chapitre.
Le second chapitre résumera une étude intermédiaire que j'ai effectuée sur le lexique français des mots de 10 lettres et qui permet de mieux cerner la nature des informations graphiques que l'œil utilise lors de chaque fixation. Si l'écrit est un langage pour l'œil, il est probable qu'une partie des compétences techniques se construisent à l'intersection des caractéristiques de la vision et des caractéristiques du système de codage que l'écrit utilise.
Dès lors, il est possible de présenter dans le troisième chapitre les hypothèses de travail et la méthodologie de la recherche conduite sur la population dont la présentation fait l'objet du chapitre quatre. Il s'agit finalement de déterminer quelles sont les compétences techniques révélées par des situations artificielles de rencontre avec l'écrit qui contribuent à l'établissement de la performance de lecture et, au delà de repérer sur quelles spécificités du fonctionnement du système graphique s'élaborent ces compétences, ce qui devrait permettre de procéder à une première approche de la " conscience graphique ".
Le cinquième chapitre présentera donc les huit épreuves graphiques (hors situation de lecture) qui vont être utilisées. Le traitement des résultats dans une analyse en composantes principales permet dans le sixième chapitre de passer de la réussite à ces épreuves à la définition de compétences techniques. Les corrélations et les oppositions entre ces différents scores permettent de découvrir quelques savoir-faire transversaux probablement à l'œuvre simultanément dans les situations artificielles même si elles ont été conçues pour isoler au mieux les variables, ce qui explique qu'elles ne soient pas des situations réelles de lecture.
De la même manière, le septième chapitre présente les quatre épreuves utilisées pour évaluer la lecture ainsi que le score composite qui en a été tiré. A travers ce résultat, on prétend cerner avec précision un niveau de lecture mesuré sur des situations de lecture fort différentes mais très révélatrices de ce que c'est que lire, et bien lire, pour un élève à son entrée en sixième.
Enfin le dernier chapitre interroge, grâce aux régressions multiples, le rapport, au sein de notre population, entre cette performance de lecture et des compétences techniques sur l'écrit afin de déterminer lesquelles contribuent à la lecture et peuvent, à ce titre, être présentées comme compétences graphiques. On verra, parmi la douzaine de pôles que forment la suite des composantes principales qu'il est possible d'approfondir le modèle interactif par lequel se décrit aujourd'hui la lecture en révélant la spécificité des opérations qu'autorise l'écrit.
Chapitre 1 : Cadres théoriques et expérimentaux.
Cette conception communément admise oblige à différencier deux sources d'informations
qui vont interagir : Deux grandes familles de processus cognitifs sont à l'œuvre dans la lecture,
au travers de ces types de données : Le modèle dit "de bas en haut" considère que les données et leur traitement
dirigeraient la construction de la signification. Pour le modèle dit "de haut
en bas", ce seraient les concepts, les connaissances du lecteur qui guideraient
son traitement des données du texte.
Certains psychologues américains (PERFETTI 1982, LESGOLD & PERFETTI 1985),
se référant aux théories du traitement de l'information, insistent sur l'existence
d'un "processeur central", sur le plan cognitif, qui gérerait les données d'ordre
inférieur (lettres et mots) et les données d'ordre supérieur (connaissances
du lecteur) au croisement des processus ascendants et des processus descendants.
Leur hypothèse d'une capacité limitée de traitement les conduit à privilégier
l'automatisation des procédures de bas niveau (que certains réduisent aux associations
grapho-phonologiques) afin de "libérer l'attention active mobilisée pour traiter
le flux ascendant d'informations" (ADAMS & STARR 1982).
Les modèles interactifs définissent l'interaction comme la combinaison de sources
multiples d'information pour produire des processus tels que, par exemple, l'identification
d'un mot. Ainsi le modèle de PERFETTI (1982) est interactif au sens où cet auteur
affirme que "les décisions d'identification des mots sont guidées par les informations
conceptuelles de haut niveau", Mais son interactivité est définie comme "faible",
car même "si les lettres et le contexte affectent tous les deux l'identification
des mots, ils n'ont pas nécessairement d'influence directe l'un sur l'autre".
Le débat ainsi abordé concerne la nature de l'interactivité et il ne peut être
poursuivi sans faire référence à deux paradigmes explicatifs : celui de FODOR
(1.1) et celui de JOHNSON-LAIRD (1.2).
1.1 Le modèle de FODOR (1983) Les travaux portant sur des enfants en cours d'apprentissage tentent de mettre
en évidence la faible influence du contexte sur la lecture de mots par les "bons"
apprentis lecteurs (PERFETTI & al. 1979). STANOVICH (1981) indique que ce sont
les "moins bons" lecteurs qui semblent le mieux profiter des effets facilitateurs
du contexte ; il justifie ce résultat en ajoutant que c'est la maîtrise de procédures
automatisées d'identification de mots qui rend les "bons" lecteurs moins dépendants
du contexte. L'hypothèse explicative généralement retenue est celle d'un "processus
interactif compensatoire" selon lequel les processus descendants viendraient
suppléer la faiblesse des processus ascendants, autrement dit que la dépendance
des "faibles" apprentis lecteurs vis-à-vis du contexte serait due à la médiocre
automatisation de leurs procédures de reconnaissance des mots. Cette hypothèse
se réfère au paradigme de FODOR : les interactions auraient lieu à la sortie
des modules, après l'échec des procédures d'identification automatique. En effet,
selon FODOR, les informations linguistiques provenant des niveaux supérieurs
de traitement (syntaxiques et sémantiques) ne seraient pas susceptibles de moduler
les premières étapes du traitement lexical. C'est cet argument qui est constamment
repris aujourd'hui pour justifier le retour à un travail systématique d'enseignement
du code de correspondance grapho-phonologique au début de l'enseignement de
la lecture. On peut, à ce propos, s'interroger sur l'amalgame qui est fait entre
automatisation des procédures de bas niveau et automatisation des règles de
correspondance grapho-phonologique. N'y aurait-il donc comme procédure de bas-niveau
que le décodage grapho-phonologique ? Peut-on admettre que les processus automatiques
soient moins sensibles que les processus "attentionnels" aux effets d'inhibition
dans le cas de non-congruence entre le contexte et le mot-cible en raison de
l'inégale "charge" cognitive qu'ils représentent et de leur inégale vitesse
d'exécution.? En tout cas, rien ne permet d'affirmer que ces processus automatiques
se réduisent à l'encodage grapho-phonologique ; au contraire, on peut envisager
l'automatisation des procédures de reconnaissance visuelle et la structuration
d'un répertoire graphique comme d'autres moyens (plus efficaces ?) d'atteindre
ce résultat.
1.2. Le modèle de JOHNSON-LAIRD (1983) Comme le prévoit le modèle de Johnson-Laird, ces travaux montrent des relations
d'interdépendance entre les différents processus : identification des mots,
interprétation... Au plan des traitements linguistiques (syntaxique, sémantique,
pragmatique), ils conduisent à réexaminer positivement les modèles d'activation
de diverses sources d'information, y compris contextuelles (modèles d'activation
à seuil, comme celui de MORTON).
Le débat concernant le rôle respectif des processus ascendants et descendants
dans la compréhension du langage écrit reste donc, en résumé, totalement ouvert
au niveau des processus ; demeure la question de savoir jusqu'où les traitements
descendants (connaissances préalables du sujet sur le monde, sur les textes,
sur la langue, sur les conditions de production...) peuvent prévaloir et interagir
avec les traitements ascendants des "entrées" graphiques.
2. Quelques travaux expérimentaux antérieurs L'étude de la compréhension reste encore peu développée, sans doute en raison
de l'immense complexité des processus, où tout se modifie simultanément et en
interaction : les signifiants, les signifiés, les procédures, les capacités
de contrôle, etc… (FAYOL, 1989). De nombreuses recherches ont lieu sur des phénomènes
précis, présentant des difficultés particulières, comme la maîtrise des anaphores
pronominales dans la lecture (REMOND, 1993), la maîtrise des connecteurs logiques,
spatio-temporels… On sait également que la compréhension d'un texte repose sur
un " pilotage " exercé en fonction des buts du lecteur et de la prise en considération
de schémas conventionnels de textes (DENHIERE, 1992).
En revanche, le courant dominant des recherches en psychologie expérimentale
s'intéresse aux mécanismes de perception et d'identification des mots, ainsi
qu'à l'accès et à l'intégration de ces données dans un lexique mental. Ses représentants
considèrent que seuls leurs travaux de reconnaissance de mots sont spécifiques
de la lecture, alors que les phénomènes de compréhension sont " communs aux
aspects de la compréhension de la parole " (SINATRA, 1990 ; ALEGRIA, 1991).
Pourtant, le message oral s'écoule de manière irréversible et s'oppose en cela
à la permanence de l'organisation spatiale de l'écrit. Même s'il peut être interrompu
et questionné, il reste dans le domaine du temporaire. " Dès que le texte reste
disponible, dès que le lecteur peut moduler sa vitesse de lecture et revenir
à volonté en arrière, la compréhension [du langage écrit] n'obéit sans doute
plus aux mêmes règles " (FAYOL, 1992). On pourrait sans doute aller encore plus
loin en rappelant la très faible segmentation du langage oral par rapport aux
marques importantes de coupures (mots, phrases, paragraphes) du langage écrit,
ou encore l'extrême différence de vitesse de traitement (50 000 mots/heure pour
un lecteur expert, contre 10 000 mots/heure pour l'oral) ; cette différence
doit bien être influencée par la nature des opérations en jeu.
2.1. Autonomie entre la reconnaissance des mots et le contexte.
En résumé, pour les tenants de cette dissociation entre le contexte et l'identification
des mots, le lecteur commencerait par traiter les données graphiques, à un niveau
inférieur, puis le résultat de cette tâche serait communiqué de manière hiérarchique
à un niveau de traitement supérieur. La détection des mots serait donc insensible
aux effets de contexte, effets qui n'entreraient en jeu que dans les processus
de décision relevant d'un niveau de traitement plus élevé (FORSTER, 1979) .
Les différents sens des mots possibles seraient ainsi tous activés, le contexte
se chargeant ensuite de la sélection du bon sens.
Ce type de travaux s'inscrit tout à fait dans l'hypothèse modulariste (FODOR,
1983). On y considère que le contexte discursif précédant un mot (ambigu par
exemple) n'est d'aucune utilité sur les premiers moments du processus d'assignation
de sens. Le contexte ne commencera à jouer un rôle que quand le sens sera sélectionné.
Le lecteur accédera à la signification du mot dans un processus temporel qui
est indépendant du contexte discursif. Dans le cas d'un accès au sens d'un mot
ambigu (soit parce qu'un des sens est très fréquent mais improbable dans ce
contexte, soit parce que plusieurs sens ont tous le même degré de possibilité),
pour chacun des sens successivement révélé, le "processeur" va essayer de l'incorporer
au contexte. Quand un des sens est intégré avec succès, le processus d'accès
lexical sera stoppé. Plus concrètement, ce modèle présuppose que le sens dominant
d'un mot ambigu sera sélectionné en premier. Le modèle de Fodor considère que
le "processeur" essayera d'intégrer le sens au contexte précédant dès qu'il
y aura accès.
Dopkins (DOPKINS, 1992) a travaillé sur la lecture de phrases contenant des
mots-cibles ambigus possédant un sens dominant et un sens secondaire. Ils sont
précédés de contextes antérieurs "positifs" (qui influenceraient la sélection
du sens secondaire d'un mot, sans rendre impossible le sens dominant), "négatifs"
(qui empêcheraient la sélection du sens dominant) ou encore "neutres" (sans
influence possible sur la sélection du sens). Il a fait suivre ces mots-cibles
de séquences levant l'ambiguité, mais toujours en n'autorisant que la sélection
de la signification secondaire du mot-cible. Dans le cas du contexte antérieur
positif, le modèle de Fodor prévoit que le "processeur" intégrera le sens dominant
du mot-cible, sans recourir au sens secondaire, puis continuera la lecture du
reste de la phrase. En y rencontrant la séquence désambiguïsant le mot-cible,
le "processeur" réalisera sa faute et recalculera le sens du mot. Dans le cas
du contexte négatif, le contexte précédant le mot-cible interdira au "processeur"
d'intégrer le sens dominant et attendra que le processus d'accès lexical lui
propose le sens secondaire. Du coup, le matériel linguistique suivant le mot-cible
ne jouera plus son rôle désambiguïsant.
En conséquence, ce genre de prédiction amène à prévoir : Ce genre de système reste très marqué par l'approche computationnelle du cerveau.
On y conçoit un mode de travail séquentiel, certes très rapide, mais toujours
très proche du type de fonctionnement d'un ordinateur. Si un temps, on a cru
pouvoir modéliser un certain nombre de fonctions cérébrales supérieures, aujourd'hui
le propos est certainement de souligner les différences essentielles de comportement
entre un cerveau et un ordinateur (DAMASIO, 1995 ; BERTHOZ, 1996).
2.2. L'importance du contexte dans la reconnaissance des mots.
Si l'on continue l'exemple donné précédemment, traitant des contextes positifs,
négatifs ou neutres, un modèle plus interactif prévoit que le contexte précédant
le mot-cible aura un effet sur l'accès initial à la signification en cas de
contexte positif, mais pas si le contexte est négatif ou neutre. Dans le contexte
positif, le matériel linguistique contient des informations qui influencent
le choix du sens secondaire, favorisant donc sa sélection première, avant de
se mouvoir sur la suite de la phrase. Dans les conditions négatives et neutres,
le contexte ne permettra pas de "pré-lever" le sens secondaire et l'on se retrouverai
proche du problème décrit plus haut. Dans le contexte négatif, le sens dominant
ne devrait pas être sélectionné, mais le modèle prévoit plus de bénéfices positifs
que négatifs. En effet, si le modèle permettait des incrémentations négatives,
il deviendrait impossible de prendre des décisions dans un contexte discursif
complet, tant les mots recèlent de sens cachés et donc inappropriés à un contexte
particulier. Ce modèle prévoit donc : Un point important reste en suspens dans ce modèle : que se passe-t-il pour
les mots ambigus en contexte positif ? Dans ce cas, le contexte précédent va
influer sur la sélection du sens secondaire, de sorte que la signification sera
accessible plus tôt. Il est impossible de prédire le gain exact dans ce cas.
Soit le sens secondaire est activé en même temps que le sens dominant et les
deux significations sont en concurrence, soit le sens secondaire est accessible
avant le sens dominant, car le contexte le fera devenir temporairement dominant.
Malgré tout, dans ce cas, la résolution du dilemme se fera avant de continuer
la lecture. On est ici devant un cas exemplaire de la question de la force de
l'interaction. Soit elle est faible et les deux sens sont en compétition et
le contexte résout le problème, soit elle est forte et elle l'a résolu avant,
en modifiant de façon temporaire la représentation dominante du mot ambigu.
Dopkins, Morris et Rayner ont montré que le temps de fixation sur les mots
ambigus (comprenant le premier passage et les retours éventuels sur ces mots)
était significativement inférieur pour les contextes positifs et négatifs. En
conséquence, il semble bien exister un effet de contexte sur les processus d'identification
des mots, amenant ces auteurs à déclarer " ces résultats sont incompatibles
avec le modèle modulariste et suggèrent que le contexte influence l'accès au
lexique" (DOPKINS, 1992).
De nombreux travaux se situent dans cette optique qui semble aujourd'hui dominer
le champ, même si la force de l'interaction reste très discutée. Citons en particulier
Trueswell qui travaille sur des ambiguités grammaticales, introduites par des
formes passives. Il postule pour encore plus d'interactivité, non seulement
lexicale, mais aussi grammaticale et thématique (TRUESWELL, 1994). Il intègre
aussi des compétences linguistiques en travaillant sur les fréquences de formes
verbales dans cette résolution d'ambiguïtés sur le passif. Notons que sur un
plan purement lexical, on a pu observer des effets de fréquence du vocabulaire
sur le temps de fixation des yeux (VITU, 1990 ; INHOFF, 1986).
2.3. Une réflexion critique sur ces travaux Tout d'abord, on comprend bien le continuum que représente l'appel au contexte
sur la façon de prendre des décisons quand au sens des mots. D'un côté, il n'existe
que pour juger le sens après qu'il ait été sélectionné, de l'autre il contraint
la sélection du bon sens (même si après, cette décison peut être remise en cause).
On va donc d'un processus autonome à une prise en compte de différents aspects
dans la reconnaissance des mots. Cependant, le contexte, quand il est évoqué
par des psycho-cognitivistes de laboratoire, reste cantonné aux quelques mots
précédant une ambiguité. Or, qu'il joue ou ne joue pas, ce contexte est nécessairement
bien plus vaste et s'il joue, il inclut alors une multitude de compétences et
de savoirs qui ne sont jamais pris en compte par ces recherches. On peut donc
supposer qu'on est loin d'avoir épuisé la question et que le contexte peut jouer
un rôle plus important que ce qui est décrit ici.
D'autres part, ces expériences s'intéressent à la reconnaissance de mots isolés,
dans des dispositifs expérimentaux très réducteurs. Il importe pour ces recherches
que l'œil fasse une fixation sur chacun des mots présentés. Pourtant, affirmer
avec Gombert (GOMBERT, 1996) que l'on sait, maintenant que l'on peut enregistrer
des mouvements extrêmement rapides, que l'œil se pose pratiquement sur tous
les mots du texte est une extrapolation audacieuse des travaux de recherche
en cours. Pour autant, ces travaux sont à examiner avec attention. Bien peu
annoncent la "vitesse de compréhension" du lecteur au cours de leurs observations.
Il semble toutefois qu'un accord existe sur la durée des deux événements repérables
: en moyenne, 250 millièmes de seconde pour une fixation et 50 ms pour une saccade
de déplacement (VITU, 1990). Si l'on tient compte des retours en arrière et
des passages à la ligne, on peut alors considérer qu'il y aurait dans une lecture
suivie environ 13 000 paires fixation+déplacement à l'heure. S'il était exact
que chaque mot donne "pratiquement" lieu à une fixation, on ne dépasserait pas
une vitesse de lecture de 13 000 mots/heure, à rapporter, comme par hasard à
la vitesse de l'oralisation et au choix des conditions expérimentales. Pour
autant, les bons lecteurs en lecture "intégrale" (donc sans recourir à "l'écrémage")
comprennent aisément un texte ordinaire à plus de 20 000 mots/heure. Aucun chercheur
ne devrait pouvoir affirmer aujourd'hui et en ces termes que l'œil s'arrête
sur tous les mots.
Bien au contraire, une recherche conduite en 1991 à l'INSERM U305 de Toulouse
par L.BASSOPU, M.GRANIE, A.P.PUGH et J.P.MORUCCI sur la coordination binoculaire
chez de jeunes lecteurs apporte de nouvelles précisions. Ces chercheurs tiennent
notamment compte de la vitesse de lecture des sujets. "L'amplitude de la saccade
de progression détermine la plage de lecture. Plus celle-ci est étendue, plus
le nombre de fixations est réduit et plus la lecture est rapide. Les lecteurs
lents (vitesse de lecture inférieure à 9000 mots/heure) font des saccades de
progression de faible amplitude par rapport aux lecteurs rapides (2°39' contre
4°23)." Cette amplitude est donnée ici en degrés d'arc mesurant l'angle visuel
. Dans leur protocole de recherche, une ligne de texte est vue sous un angle
de 21°10' et, par exemple, le mot "les" affiché à l'écran est vu sous un angle
de 1°08'. Si une saccade moyenne chez un lecteur lent (2°39') dépasse déjà la
longueur moyenne d'un mot (entre 5 et 6 caractères en français), c'est plus
du double chez un enfant de 10 ans bon lecteur, soit en moyenne 3 mots, ce qui
ne signifie pas non plus une amplitude régulière et mécanique des empans mais
invalide complètement l'existence d'une fixation par mot. Notons que les meilleurs
lecteurs que nous avons pu voir lisaient à des vitesses voisines de 60 000 mots/heure,
soit environ 100 signes par seconde. A cette vitesse-là, nous arrivons à des
empans moyens de 25 signes soit environ 6 mots. De ce rapide calcul, nous pouvons
déduire que la taille de l'empan de lecture pour un lecteur véritablement expert
est d'environ 10°, soit approximativement la moitié d'une ligne.
Le recrutement, par les laboratoires de recherche, des sujets d'expérience
se fait, le plus souvent, parmi les étudiants de l'université, sans jamais mesurer
leur degré de compétence en lecture. Nos propres observations, portant sur des
populations de professeurs, montre une vitesse moyenne de lecture de l'ordre
de 12 000 mots par heure. On verra plus tard que certains enfants de notre cohorte
ont déjà des performances bien supérieures… Il est donc évident que les études
de psychologie ne tiennent pas compte de ce qui se passe ordinairement chez
un lecteur expert en situation réelle de lecture. Et, en particulier, si l'empan
de lecture augmente de façon aussi considérable, peut-on se dispenser de s'interroger
sur les performances intrinsèques de l'œil.
2.4. Vision nette et vision dégradée
La vision fovéale, donc la vision la plus nette, couvre environ 1° du champ
visuel, chez l'Homme, alors que le champ total, incluant la vision périphérique,
totalise près de 160° degrés. La dégradation de la netteté se fait progressivement,
au rythme d'environ 50 % de dégradation par degré d'écartement.
Nous avons vu que chez un lecteur expert, la taille de l'empan de lecture peut
atteindre 10°. En conséquence, ce lecteur traite des informations très dégradées
en bord d'empan, informations provenant des régions plus périphériques de l'œil.
Ces régions sont communément appelées parafovéales. Elles jouent sans conteste
un rôle à chaque fixation de l'œil. 2.5. La vision parafovéale et la lecture (recherches récentes)
On a pu croire que la reconnaissance des mots pouvait se faire de manière séquentielle,
ce modèle étant défini par TAFT & FORSTER (TAFT & FORSTER, 1976). Il s'agirait
ici d'un accès dans un fichier qui contiendrait des représentations de morphèmes
des radicaux, classées par fréquence. La vision parafovéale aurait donc permis
de pré-activer la bonne entrée dans ce " fichier ", grâce à la vue anticipée
du radical du mot suivant. Inhoff (INHOFF, 1989) montra que cette hypothèse
était fausse. Il rejeta aussi, l'hypothèse de l'influence de la première syllabe
comme activation du mot à trouver ("La reconnaissance d'un mot lors de sa fixation
n'est facilitée par la vision parafovéale antérieure de ses premières lettres,
qu'elles forment une syllabe ou non. " ).
Les observations conduisent cet auteur (et de nombreux autres à sa suite) à
recommander des modèles qui contiennent au moins deux aspects. Les modèles viables
doivent d'abord considérer que le début et la fin des mots contribuent à la
reconnaissance périphérique des mots et ensuite que les bénéfices dus à la vision
parafovéale sont fonction de la totalité de la morphologie du mot dans lesquelles
les lettres apparaissent. En effet, on obtient de plus grands bénéfices en tenant
compte des informations données par l'ensemble du mot périphérique qu'en cumulant
les données issues du premier trigramme et de la fin du mot.
Ce type d'observation renforce les modèles de reconnaissance logographique,
développés en leur temps par Adams (1979), McClelland & Rumelhart (1981). Ces
modèles semblent offrir un bon point de départ pour la compréhension des bénéfices
de la vision parafovéale dans la lecture normale. Par exemple, " toutes les
lettres (où les silhouettes des lettres) d'un mot accessible par la vue périphérique
peuvent activer des représentations de lettres (et de possibles représentations
lexicales) " (INHOFF, 1989).
Ces modèles logographiques sont aujourd'hui très décriés, surtout dans les
modèles développementaux de la lecture. On les considère comme des phénomènes
très primitifs (" …les modalités primitives (logographiques) de traitement de
l'information graphique ") (SPRENGER-CHAROLLES, 1992), appelés à être remplacés
par des modalités grapho-phonologiques ou alphabétiques (FRITH, 1986 ; GOMBERT
1996). On associe, souvent de manière caricaturale, cette capacité à certains
types d'enseignement " qui prennent la lecture pour une tâche de mémorisation
visuelle " (MORGAN & COLTHEART, 1988). Pourtant, elles semblent nécessairement
à l'œuvre dans la reconnaissance par la vue périphérique, capacité " mathématiquement
" indissociable d'une lecture experte.
En effet, ces travaux continuent de faire l'hypothèse que l'on marque un temps
d'arrêt sur chacun des mots d'un texte. Il est facile de montrer qu'il n'en
est rien. Il faut en déduire que le cerveau d'un lecteur traite les informations
floues, parafovéales, non seulement pour guider la position du point de fixation
suivant, mais aussi pour en extraire des données sémantico-lexicales.
2.6. Quelques travaux ophtalmologistes Des données visuelles, N lettres identifiables clairement ; plus des données
périphériques de moindre résolution, qui présentaient les lettres par des *
et les espaces par des signes (_). Un peu comme des données de bas niveau… Les distributions des saccades oculaires furent mesurées pour des empans visuels
variant de 1 à 11 lettres.
Variation du champ périphérique.
Ainsi, si la vision d'un empan se limite à la zone centrale, les performances
diminuent sensiblement, les mouvements des yeux deviennent erratiques (on constate
un grand éparpillement des saccades). Les informations données par les zones
périphériques jouent donc un grand rôle dans la fluidité de la lecture.
L'influence du lexique sur les saccades
Dans une autre expérience, on introduit deux types de lexique, variant par
leur taille et par la connaissance du lexique que l'on peut avoir. La figure
8 montre une augmentation de la taille des saccades quand on mobilise des connaissances
lexicales, ce qui conforte un peu plus les hypothèses interactionnistes. 2.7. La saccade occulaire. Le mécanisme neuronal de production des saccades est contrôlé au moins autant
par des neurones excitateurs que par des neurones inhibiteurs. Ainsi, "la
décision de faire un mouvement des yeux, accompagné ou non d'un mouvement de
la tête est prise à travers une hiérarchie de mécanismes parallèles excitateurs
et inhibiteurs" (BERTHOZ, 1996). Il semble que l'évolution ait amené dans
le cerveau des primates un bien plus grand nombre de mécanismes inhibiteurs,
ce qui a été utilisé pour "bloquer l'exécution d'un mouvement, de façon à
permettre la simulation interne des mouvements planifiés et à tester de façon
endogène ses conséquences potentielles" (BERTHOZ, 1996). Ces simulations
permettent de faire des prédictions et de " sélectionner les stratégies motrices
". De plus quelques données montrent même, dans certaines conditions, une capacité
du cerveau à anticiper sur la saccade qui suivra la saccade à faire.
On peut donc déduire de ces quelques faits, l'extrême capacité du cerveau à
simuler les actions à effectuer, dont les saccades oculaires, à les piloter
en fonction du résultat qu'il pense en obtenir. On n'est plus du tout dans une
conception mécanique de la saccade, comme une suite de mouvements servant à
prélever de l'information, on est bien dans un mouvement dont les conséquences
ont déjà été anticipées. La perception n'est plus seulement préparatoire à l'action,
c'est l'action qui définit la perception dont elle a besoin.
Berthoz a résumé ce nouveau modèle en écrivant que "le cerveau n'est pas
une machine réactive, c'est une machine proactive qui projette sur le monde
ses interrogations" (BERTHOZ, 1996b). Sauf en lecture ?
3. Première conclusion Nous avons insisté sur l'importance des données contextuelles pour la reconnaissance
des mots (bien que cette hypothèse ne soit pas celle majoritairement retenue
dans le domaine de la pédagogie, si l'on se réfère aux instructions officielles
ou aux contenus de manuels scolaires). Thèse néanmoins chère aux interactionnistes.
L'interaction pose cependant également un problème : présentée d'abord comme
une modélisation du processus de lecture, c'est-à-dire de l'opération qui permet
d'attribuer une signification à de l'écrit, elle devient progressivement l'opération
par laquelle s'opère l'identification de l'écrit (les unités de haut niveau
se réduisant alors à des effets de contexte), renvoyant à l'extérieur de l'interaction
(ensuite) la compréhension de cet écrit identifié, c'est-à-dire décrypté. Ce
qui reviendrait alors à nouveau à séparer le processus interactif de l'intention
de lecture, autrement dit à le rendre autonome de l'intention de lecture. Ne
retourne-t-on pas à l'encapsulage du processus interactif dès lors qu'on propose
de remplacer la définition " lire, c'est comprendre " par " lire, c'est pour
comprendre " ?
Pourtant, l'intention semble bien être la base de l'action. Aucun des modèles
psychologiques que nous avons étudié ne met au centre de l'action le but qu'elle
se fixe, que l'objet d'étude soit la saccade oculaire, l'identification de mots,
la compréhension d'un énoncé. Cela nous semble un point assez faible des modèles
explicatifs de la lecture. On se contente d'étudier la (une) façon dont le cerveau
traiterait des stimuli, en construisant des modèles qui éloignent le but de
l'action. Or les neurophysiologistes les plus avertis considèrent le cycle perception-action
comme indissociable. " L'exploration du monde visuel par un sujet serait défini
par des schèmes anticipatoires définis comme des plans pour l'action perceptive.
" (BERTHOZ, 1996b). Cette grande place accordée à l'anticipation est de fait
exclue des recherches que nous avons citées auparavant qui déconnectent la perception
de cette anticipation.
Un autre point préoccupant est la non prise en compte du niveau de lecture
des sujets participant aux expériences de psychologie cognitive. Alors qu'on
prétend étudier une lecture " experte ", on ne contrôle pour ainsi dire jamais
cette variable. Or, le problème de la vitesse de lecture est en réalité celui
de la taille de l'empan à chaque point de fixation de l'œil. Presque toutes
les recherches reposent sur le postulat d'un point de fixation par mot. Nous
avons vu que cette assertion est impossible, et que le lecteur expert procède
par groupes de plusieurs mots. Il est donc confronté à des informations dégradées
à la périphérie de son point de fixation.
Les lettres se situant en dehors de la zone nette (3-4 lettres) sont de moins
en moins identifiables au fur et à mesure qu'elles s'éloignent du centre de
la fixation oculaire. Comment sont-elles traitées ? Nous allons, dans le chapitre
suivant, nous livrer à une simulation de cette vue dégradée en utilisant cette
fois comme matériau d'étude les mots français.
Chapitre 2 : Empans et silhouettes de mots : une
vue statistique sur le lexique français des mots de dix lettres. La comparaison des deux empans oblige à se demander pourquoi la plage d'écrit
chez le lecteur expert déborde largement les trois ou quatre signes concernés
par la zone de netteté de l'empan visuel, alors qu'on sait que la perte de netteté
est déjà de 50 % à 1 degré de part et d'autre de la fixation, et se dégrade
de 50 % à chaque degré supplémentaire. On peut se demander si le lecteur expert
ne travaille pas majoritairement sur du flou, autrement dit si le lecteur expert
n'utilise pas un autre système de codage que celui constitué des quelques 80
signes du système alphabétique, un système de codage beaucoup plus court (constitué
de beaucoup moins d'éléments) puisque, en vision floue, plusieurs vont être
remplacées par une même forme, une même silhouette. Ce système de codage court
qui correspondrait à la réalité de la vision parafovéale fait perdre de l'information.
Par quoi le lecteur expert remplace-t-il cette information manquante dans le
bas niveau ? Cette information compensatrice ne peut provenir que du haut niveau
(il n'y a pas de troisième source). Cette information viendrait alors déjouer
le flou, lever les ambiguités en créant un horizon d'attente dans lequel le
codage court redeviendrait pertinent.. Je crois qu'on cherche très loin le principe
de l'interaction alors qu'il est peut-être là sous nos yeux, à tous les sens
du mot. Les informations graphiques ne sont pas exploitables de la manière où
on les voit, elles ne permettent pas d'identifier un signifiant, et encore moins
un signifié si on ne va pas à leur rencontre muni d'informations probabilistes
qui anticipent l'incertitude. On rejoindrait alors les analyses de BERTHOZ :
la prise d'informations et la compréhension, c'est la même opération, ce qu'a
tendance à faire oublier le mot interaction qui en vient à faire exister deux
processus distincts qui se rejoindraient. Ne vaudrait-il pas mieux imaginer
qu'il y a deux sources d'informations qui sont traitées par une seule opération
?
Mais cette interaction n'est "visible" qu'à travers l'impossibilité de comprendre
des mots formés de caractères flous ; on ne peut l'observer que chez le lecteur
expert en situation de lecture. Dès qu'on quitte cette position, on se retrouve
à travailler sur un codage long et en vision fovéale : les informations graphiques
peuvent être efficacement transformées sans recours à d'autres informations
sauf un système autonome de décodage ; il n'y a plus d'interaction mais une
identification qui précède un traitement. En 1994, sans connaître la recherche
de LEGGE, j'ai procédé, à la demande de l'équipe INRP/AFL, à une simulation
de cette interaction par ordinateur, travail qui a donné lieu à la publication
d'un article en 1995 dans LES ACTES DE LECTURE.
La question : est-ce le même traitement de l'information, le même processus
psychologique qui permet de comprendre un texte, selon que l'information prélevée
est de 2 ou 3 lettres vues simultanément ou d'une quinzaine individuellement
mal identifiables ? Au cours de la lecture, que faut-il ajouter pour qu'un groupe
de mots s'identifie, non à partir des lettres qui le composent, et que l'œil
ne peut voir dans leur détail, mais à partir d'une silhouette créée par la forme
générale de ces lettres perçues en vision périphérique ? L'article s'est intitulé
: Empan et silhouettes. Il s'agit essentiellement d'une approche statistique
des phénomènes de silhouettes sur les mots français de huit à onze lettres,
approche croisée avec une indexation sémantique et syntaxique de ces mêmes mots.
Nous avons envisagé principalement ceux de 10 lettres, leur taille garantissant
à la fois une fréquence relativement élevée, et une complexité lexicale.
Pourquoi retenir sept formes plutôt que cinq ou quinze? Aucun choix ne saurait
se justifier complètement. Et là n'est sans doute pas la question car personne
ne sait les formes de lettres que chaque lecteur opérationnalise. Ce que nous
allons tenter de mettre en évidence avec ce regroupement des lettres en sept
formes serait sans doute localement différent avec un autre choix mais ne serait
pas, pour autant, affecté dans sa signification générale qui porte sur les conséquences
du passage d'un codage long à un codage plus court.
Deux mots distincts peuvent avoir exactement la même silhouette. Le nombre
théorique de silhouettes différentes qui pourraient se rencontrer en combinant
sept formes différentes de lettres à n'importe quelle place dans un mot de 10
lettres est la dixième puissance de 7, soit : 282 475 249.
Voici le tableau résultant de la transformation des lettres par le codage en
7 formes :
Mot(s) par silhouettes
Nombre de Silhouettes
%
Nombre de mots
%
1
18987
68,83 %
18987
47,59 %
2
6547
23,73
13094
32,82
3
1060
3,84
3180
7,97
4
658
2,38
2632
6,59
5
182
0,66
910
2,28
6
79
0,29
474
1,18
7
27
0,10
186
0,47
8
15
0,05
120
0,2
9
9
0,03
81
0,2
10
12
0,04
120
0,3
11
0
12
1
0,003
12
0,03
13
1
0,003
13
0,03
14 et +
6
0,02
84
0,21
27584 silhouettes
39896 mots
Les mots de 10 lettres donnent 27 584 silhouettes distinctes ; 8 597 silhouettes
auxquelles au moins deux mots correspondent ; 18 987 mots originaux c'est-à-dire
qui sont seuls à avoir la silhouette qu'ils ont. On rencontre donc, en moyenne,
2.43 mots par silhouette "multiple" et, d'une manière générale, le rapport entre
le nombre de mots de 10 lettres et le nombre de leurs silhouettes est de 1.45,
ce qui semble assez faible. En effet, on passe d'un codage à l'aide de 38 signes
(on n'a pas utilisé ici les majuscules ni les signes de ponctuation) à un codage
à l'aide de 7 signes donc un répertoire de signes 5 fois moins étendu et on
aurait pu s'attendre à ce que ce codage court différencie beaucoup moins bien
les mots réellement codés par 38 éléments. Il y a, certes, une perte du pouvoir
différenciateur de la silhouette par rapport au mot réel mais faible puisqu'on
passe de 1 mot pour 1 mot à 1 silhouette pour 1.45 mots. Cette perte est à rapprocher
du gain puiqu'avec ce codage court, l'empan de lecture "traite" dans le même
temps cinq fois plus de matière que l'empan visuel. Nous ne sommes pas, pour
autant, en train de suggérer qu'il serait plus simple de remplacer l'alphabet
par sept archi-signes. La vision parafovéale s'en charge bien toute seule...
2.1 Les Mots=silhouettes (silhouettes
originales) Ces 18 987 "mot=silhouette" constituent une catégorie intéressante : chaque
mot a une silhouette originale. Par exemple, le mot "prendrions" a la silhouette
ynanbnlana et cette silhouette ne correspond qu'à prendrions. On rencontre dans
cette catégorie des mots peu fréquents en français (par exemple, bouquetins,
inventorié, hypnotisme) mais aussi des mots fréquent (tels population, professeur,
mettraient). On peut affirmer que si l'alphabet ne comptait que les 7 "archi-signes"
retenus, au lieu des 38 lettres usuelles, ces mots continueraient à être parfaitement
différenciés par leur silhouette. Avec d'autres archi-signes, on obtient certes
d'autres résultats mais qui ne changent rien à la problématique. Un codage avec
seulement 7 signes (au lieu de 38 lettres) est suffisant pour différencier 48
% des mots de 10 lettres. On perd alors leur valeur phonologique et celle-ci
ne peut plus être utilisée pour accéder au signifiant (la voie indirecte est
alors impossible). Sans doute est-ce là l'avantage de l'écriture alphabétique
dans ses rapports à l'activité visuelle au cours de la lecture : d'une part,
il y a la prise en compte des formes générales des lettres, qui permet des saccades
oculaires englobant des mots ou des groupes de mots ; d'autre part, il y a la
différenciation en vision centrale des lettres elles-mêmes mais qui ne donne
pas directement accès aux mots.
2.2 Les silhouettes ambiguës
Il y a donc 1 060 silhouettes désignant chacune 3 formes, 658 silhouettes de
4 formes, etc. 2.3 Silhouette et apparence
Nous dirons que deux mots ont non seulement même "silhouette", mais même "apparence"
quand les 2 lettres au centre sont identiques et quand les 4 lettres de part
et d'autre ont même silhouette. Par exemple, auvergnats et auvergnate ont même
apparence : leur différence n'est pas apparente dans un codage en 7 éléments,
même en identifiant les deux lettres centrales (rg). Ce sont d'ailleurs deux
formes déclinées du même mot souche. tu " ovaliseras " et tu " avaliseras "
ont, eux aussi, même apparence mais ils sont issus de souches différentes et
il est donc encore plus nécessaire de bien les différencier. Existe-t-il beaucoup
de ces doublons, c'est-à-dire de mots issus de mots souches différents et ayant
strictement la même apparence (les mêmes deux lettres au centre et les mêmes
quatre "archi-signes" de part et d'autre) ?
À défaut d'une recherche complète, voici quelques exemples de doublons. L'ordre
choisi et le partage en deux colonnes n'ont pas de signification.
crânassent avérassent
effraction attraction
effondrait attendrait
escomptiez assomption
envasaient arrosaient
opposition apposition
spectacles apostasies
encastrais ancestrale
sidérante altérante
clignement alignement
clouteront alerteront
striations adulations
chassaient adossaient
saoulaient acculaient
essouchées accouchées
chômerions abîmerions
obstineras abstinence
cheminions abominions
farfouillé barbouillé
tartelette bandelette
oreillette cueillette
excisaient croisaient
soutenance contenance
socquettes casquettes
sardinière cantinière
facilement docilement
totalement fatalement
quenouille grenouille
plissement glissement
porcheries gaucheries
L'existence de tels doublons oblige donc à s'interroger sur les informations
simultanées qui doivent nécessairement être prises pour que soient levées les
confusions sémantiques.
3. Attentes et silhouette
3.1. L'horizon syntaxique.
Le nombre de mots différenciables par le croisement de leur silhouette et de
leur appartenance à un des 32 thèmes est de 25 248 soit 6 261 de plus que par
la seule silhouette (+33 % mais + 15.7 % de l'ensemble des mots de 10 lettres).
Les 14 648 mots non différenciables se répartissent dans 6 642 silhouettes,
soit 2.2 mots par silhouette multiple. Cette fois l'augmentation du nombre de
mots identifiables par leur silhouette grâce à la prise en compte de l'attente
sémantique s'accompagne d'une réduction importante (1 955) du nombre de silhouettes
multiples. Encore convient-il de rappeler que nous n'avons pas défini l'attente
sémantique à travers les 826 mots centres que nous avons évoqués mais seulement
à travers leur regroupement en 32 thèmes généraux... On peut donc imaginer que
le pouvoir différenciateur d'une intersection " silhouette X sèmes " est encore
plus net que les résultats que nous en donnons.
On observe cette fois que 36 314 mots sont parfaitement différenciés au croisement
de leur nature grammaticale et de leur indexation sémantique (rattachement à
32 thèmes généraux), soit 17 327 de plus que par la seule silhouette (91 % de
l'ensemble des mots de 10 lettres). Il reste 3 582 mots ambigus, se répartissant
entre 1 725 silhouettes multiples mais le nombre de celles-ci diminue de 6 872.
à l’aide de la silhouette seule
à l’aide de la silhouette et de la nature grammaticale
à l’aide de la silhouette et de l’indexation sémantique
à l’aide des trois entrées simultanément
a
mot différenciés par leur silhouette seule
18 987
21 307
25 248
36 314
a/T
% sur total des mots
47,6 %
53,4 %
63 %
91 %
T-a
mots restant ambigus
20 909
18 589
14 648
3 582
Sm
Nombre de silhouettes ambiguës
8 597
8 220
6 642
1 725
Sm/S
% du nombre total de silhouettes
31 %
30 %
24 %
6,25 %
(T-a)/Sm
Nombre moyen de mots ambigus par silhouette multiple
2,43
2,26
2,20
2,08
4. Conclusions Or ce statut de signifiant visuel n'est pas séparable de la manière de voir
: selon que les recherches portent sur les stratégies du lecteur expert dont
les empans de lecture sont beaucoup plus larges que l'empan de vision nette
ou sur des stratégies construites par l'expérimentateur et qui feraient que
l'empan de lecture et l'empan de vision nette coïncident, on décrit une interaction
complètement différente. Dans un cas, l'intervention des informations de haut
niveau est nécessaire pour traiter les informations graphiques, l'interaction
est le processus organique de lecture. Dans l'autre, il se surajoute au traitement,
plutôt comme un contrôle a posteriori. On peut alors faire l'hypothèse que l'expérience
graphique du lecteur, sa conscience graphique, n'est pas de même nature que
celle d'un déchiffreur qui avancerait dans l'écrit en transformant en syllabes
les trigrammes qui s'inscrivent successivement sur sa fovéa.
Chapitre 3 : Hypothèses et Méthodologie
On a vu que la définition de l'interactivité en lecture se positionnait, selon
les recherches, sur un continuum allant du très faible à l'à peine fort. Il
y a, en outre, une dérive possible dans l'usage à la mode de ce concept d'interaction
qui vient, fort à propos, se substituer à la notion difficile à manier de rapports
dialectiques. Ainsi, les éléments, lorsqu'il s'agit d'interaction, se seraient
plus ou moins constitués séparément, aboutissant au maniement d'unités graphiques
dont l'existence ne doit rien aux raisons et à la manière de les interroger
; quant à l'autre terme, le fonctionnement conceptuel et sémantique, il serait
propre au langage en général et ne devrait rien aux caractéristiques du code
sur lequel il s'exerce. La compréhension de l'écrit n'aurait rien à voir avec
la manière dont nous rencontrons l'écrit et choisissons d'y puiser de l'information.
En revanche, dans une approche dialectique, les deux termes en relation se constituent
à travers cette relation : leur existence et leur structure ne sont pas séparables
de l'action par laquelle ils se structurent. Le système graphique s'organise
en fonction de la manière dont les éléments de haut niveau l'interrogent ; le
système conceptuel et sémantique se transforme pour intégrer la spécificité
de ces nouvelles unités d'information. C'est en ce sens, qu'avec GOODY (1979).
On peut parler de la spécificité d'une raison graphique, d'un mode de pensée
qui se construit à travers le maniement d'un langage particulier qui impose
ses caractéristiques aux processus de compréhension et, en retour, les enrichit.
Ce rapport dialectique que nous entrevoyons conduit à supposer que le "pilotage"
par les informations conceptuelles de haut niveau aboutit à une structuration
différente des processus de bas niveau. A ce titre, nous sommes assez proches
des modèles "fortement interactifs" qui envisagent eux aussi "des influences
directes entre les processus contextuels et les processus graphiques" (RUMELHART
& MAC CLELLAND, 1981).
Le lecteur choisit des indices, pas n'importe lesquels et encore moins leur
totalité, à l'intérieur de structures attendues ou activées. Autrement dit,
plus le lecteur a accès à des unités larges, plus il est à même de prélever
les seuls indices dont l'interaction a besoin, y compris en en négligeant d'autres,
redondants ou peu pertinents pour ce questionnement. Tous les mots sont susceptibles
de porter la présence ou l'absence d'indices graphiques en interaction avec
l'univers sémantique mais c'est la répétition ou la répartition de ces indices
entre plusieurs mots (donc leur repérage simultané) qui saute au... sens. C'est
le processus de compréhension (= de lecture) qui détermine la nature, la quantité
et la répartition de la prise d'informations graphiques.
En conséquence, nous poserons une première hypothèse : la performance de lecture
va de pair avec une prise d'indices diversifiés. Alors que le mauvais lecteur
se contente d'un seul type d'indices (souvent grapho-phonologiques), le bon
lecteur utilise de manière concomitante des indices de nature différente : graphique,
sémantique, grammaticale et lexicale. Cette diversité d'indices a sans doute
quelque chose à voir avec la diversité des attentes donc avec l'existence d'un
contexte ouvert.
En second lieu, on peut faire l'hypothèse qu'il existe de mauvauses façons
de prélever l'information dans l'écrit qui rendent systématiquement improbable
sa compréhension.. Contrairement à ce que pense Alegria ("L'analyse de la situation
de lecture permet de concevoir une série d'opérations élémentaires qui interviennent
dans le processus de compréhension. Une distinction importante à faire parmi
ces opérations concerne celles qui précèdent l'identification des mots et y
conduisent, de celles qui suivent l'identification." (Alegria, 1991)), et avec
lui beaucoup de recherches actuelles, nous ne présupposerons pas une indépendance
fonctionnelle entre les opérations liées à l'identification et celles liées
à la compréhension. Le principe même d'une relation dialectique plutôt que d'une
interaction impose de penser que la compréhension est le processus par lequel
se traitent les données, et que ce traitement n'est pas séparable de la manière
dont ces données sont prélevées. Il n'y a pas d'un côté une identification et,
de l'autre, une compréhension qui parviendrait plus ou moins bien à interpréter
ces données sans être pour quelque chose dans leur définition. On doit trouver
trace de cette relation dialectique dans la capacité à utiliser l'information
parafovéale, c'est-à-dire à tirer de l'information des silhouettes, ce qui suppose
la conscience d'une spécificité graphique comme langage pour l'oeil. Ainsi la
deuxième hypothèse porterait sur l'existence d'un lien entre la performance
de lecture et la capacité à utiliser les formes graphiques dégradées telles
qu'elles apparaissent en vision parafovéale. Dit autrement, il devrait exister
un lien entre la performance de lecture et la taille de l'empan de lecture.
Je voudrais signaler la difficulté que j'ai à formuler des hypothèses car la
méthodologie que j'utilise est davantage tournée vers l'investigation que vers
la vérification. Ces deux hypothèses sont alors plutôt des principes organisateurs
de la méthodologie d'investigation que des attentes qui devront impérativement
être confirmées ou refusées.
2. Méthodologie. Devant ce problème méthodologique, nous avons choisi une méthode statistique
qui semblait répondre à notre problématique : l'analyse en composantes principales.
Ce type d'analyse factorielle permet de mesurer les liaisons des variables entre
elles ; on va chercher par cette analyse à savoir comment se structurent les
variables, celles qui vont dans le même sens, ou celle qui s'opposent. Dans
le système d'épreuves que nous avons développé, nous obtenons 8 variables correspondant
aux 8 épreuves. Les différents individus auraient donc du être représentés dans
un espace à 8 dimensions. Difficile d'y voir clair… L'analyse en composantes
principales va nous permettre d'étudier des espaces plus petits, à une ou deux
dimensions. Les droites et les plans d'une analyse en composantes principales
ne sont pas réalisés avec les variables initiales, mais avec des " indices synthétiques
" obtenus par ce que les statisticiens appellent des " combinaisons linéaires
" de ces variables. Parmi tous les indices possibles, l'analyse en composantes
principales recherche d'abord celui qui permet de voir au mieux les individus,
c'est-à-dire celui pour lequel la variance des individus est maximale : cet
indice est appelé la première composante principale. Ensuite, une deuxième composante
principale est recherchée, sous deux conditions : Le processus se déroule ainsi jusqu'à l'obtention de la dernière composante
principale.
Ainsi, l'analyse en composantes principales en éliminant successivement les
corrélations multiples entre les résultats aux différentes épreuves permet de
décomposer chaque épreuve en fonction des liens multiples que son résultat entretient
avec les autres. Cette analyse aboutit à remplacer ici les résultats de 8 épreuves
(dont on ne sait pas toujours ni si elles mesurent ce qu'on croit ni si elles
ne mesurent que cela) par 8 composantes plus ou moins simultanément à l'œuvre
dans chaque résultat. C'est comme si on avait remplacé les 8 épreuves réelles
(dont chacune demande à la fois mais dans des proportions différentes plusieurs
compétences) par 8 épreuves théoriques qui (si on ne s'est pas trompé dans l'interprétation
du calcul des axes factoriels) n'interrogent chacune qu'une seule compétence.
Ce qui expérimentalement est impossible dès lors qu'il s'agit d'une tâche complexe.
On voit bien l'intérêt d'une telle démarche. À ne pas la suivre, des expérimentateurs
se condamnent à simplifier tellement la tâche que la situation expérimentale
n'a que d'improbables rapports avec ce qu'elle prétend explorer. Rend-on compte
de ce qui est à l'œuvre dans la lecture d'un texte en mesurant la variation
du temps mis pour prononcer des pseudo-mots hors contexte selon qu'ils contiennent
ou non des trigrammes fréquents ? À ne pas la suivre, on en vient à présenter
des compétences techniques sans les avoir jamais mises en rapport avec la lecture.
En revanche, il faut considérer aussi le risque que contient l'analyse des
données afin d'en tirer des composantes principales. C'est le risque inhérent
à toute interprétation et qu'on ne peut tenter de réduire que par une connaissance
minutieuse des épreuves initiales, une observation attentive de leur déroulement,
une confrontation avec d'autres travaux, etc. Pour autant, il faudra bien oser,
à un moment donné, l'hypothèse que ce qui peut le mieux rendre compte de l'opposition
de deux groupes d'épreuves de part et d'autre d'un axe, c'est une compétence
qui tourne, par exemple, autour de la sensibilité au contexte, toutes choses
étant égales par ailleurs. On mesure bien ce risque mais il y en a un autre
plus grand encore si on oublie que ces composantes ne sont construites qu'à
partir des variables d'origine. Quelle que soit la rigueur apportée ensuite
à la définition des composantes, elles ne seront jamais qu'une autre organisation,
certes plus puissante, de ce que les épreuves ont mis en œuvre. Une compétence
est une sorte d'abstraction transversale à plusieurs épreuves mais ce n'est
pas l'analyse qui la fera exister si les épreuves utilisées ne la sollicitent
pas. D'où la nécessité de les diversifier. Les 8 compétences techniques construites
ici à l'aide d'une analyse en composantes principales ne sont donc pas encore
des compétences techniques de lecture mais simplement des compétences exigées
par les seules épreuves techniques qui ont été retenues. On découvrira plus
tard que certaines, importantes dans l'effectuation des épreuves techniques,
ne jouent pas de rôle ou pas ce rôle lors d'une activité réelle de lecture.
Ce qu'on ne saura jamais, et pour cause, c'est le rôle qu'auraient joué au cours
de la lecture celles qui, n'étant pas impliquées dans nos épreuves techniques,
n'ont pas été construites par l'analyse en composantes principales. On en sera
réduit à imaginer leurs poids en creux, sinon leur nature, dans la part de la
variance qui restera inattribuée.
Ce n'est qu'ensuite que nous étudierons le poids et la valeur de ces facteurs
dans la performance de lecture. Nous le ferons cette fois au moyen d'analyses
de régression linéaire multiple pour évaluer la contribution de ces compétences
techniques à une lecture réussie. Ainsi parviendrons-nous peut-être, sinon à
quelques réponses, du moins à une manière plus pertinente de poser des questions.
Chapitre 4 : La population expérimentale
Cette étude longitudinale concernait initialement 84 enfants entrés au CP en
septembre 90. En fin de cours préparatoire (-CP-) nous disposions encore d'un
échantillon de 81 enfants. Seuls 76 d'entre eux ont pu être suivis jusqu'à la
fin du cycle 2 (-CE2-), au prix parfois d'efforts considérables (certaines épreuves
ont même eu lieu au domicile d'enfants malades!). Finalement, à la fin du
cycle 3 (-CM2-), c'est-à-dire au moment où nous nous intéressons à ces enfants
(en juin 95), nous n'en connaissons plus que 59.
Les enfants que nous avions retenus avaient tous le même âge (six ans au 1er
juin 1990, plus ou moins 75 jours). Ils étaient issus de 17 classes d'écoles
différentes, à raison de cinq par classe. Au sein de chaque classe, outre le
critère de l'âge, les enfants avaient été choisis en fonction de critères sociologiques:
2/5ème des enfants devaient avoir des parents ayant un niveau de qualification
supérieur au baccalauréat, 3/5ème un niveau inférieur (échantillonnage analysé
par ailleurs par catégorie socio-professionnelle).
Nous présentons les données pour les 59 enfants, suivies de celles pour les
76, entre crochets [], puis entre accolades {} le résultat au test du KHI-2.
L'échantillon de 59 enfants qui va être au centre de nos analyses est constitué
de 32 [39] garçons et 27 [37] filles {KHI-2 = 0,1 ; dll = 1 ; P = 73.55%}.
25 enfants (42 %) [36 (47%)] ont au moins un parent qui dispose d'un niveau
de qualification supérieur ou égal au baccalauréat; 34 (58 %)[40 (53%)] sont
dans le cas contraire {KHI-2 = 0,116 ; dll = 1 ; P = 73.27%}.
À l'issue d'un regroupement des catégories INSEE en trois grands types, nous
avons pu vérifier que: 2. Les écoles Huit de ces classes scolaires faisaient partie du réseau d'écoles expérimentales
coordonné par l'INRP dans la période 1972-1981. Ces écoles sont organisées au
sein de cycles multi-âges, ce qui conduisait vingt-huit [35] enfants de notre
échantillon à partager leur temps de travail avec des enfants d'âges différents.
Seize [23] autres enfants avaient été pris dans des classes plus "traditionnelles",
accordant notamment beaucoup plus de place à la maîtrise du code de correspondance
grapho-phonologique.
Notre population expérimentale se trouve en conséquence répartie de la manière
suivante: Au vu des tests statistiques, on peut espérer que l'échantillon des 59 élèves
reste relativement proche de la composition de l'échantillon plus vaste (les
76 enfants de CE2 et les 84 de CP) étudié par le passé.
Les élèves ont été observés à l'aide d'épreuves standardisées spéciales, décrites
dans le chapitre 5 et le chapitre 7.
Chapitre 5 : Huit épreuves graphiques
hors d'une situation de lecture. Conditions générales de passation des épreuves. 1. Épreuve A1 : tri entre pseudo-mots,
construits sur la vraisemblance de leur silhouette Les formes qui peuvent exister ont été construites sur les silhouettes les
plus fréquentes de mots de 6 lettres (exemple : avexse construite sur
la silhouette ananaa, et contenant entre autre le mot "avance"). À l'inverse,
celles qui ne peuvent pas exister, sont construites sur des silhouettes de 6
lettres qui ne contiennent aucun mot français (par exemple iwalou, construite
sur la silhouette lmalaa).
Nous avons choisi cette longueur de 6 lettres pour plusieurs raisons : c'est
tout d'abord la longueur moyenne des mots d'un texte en français ; ensuite cette
longueur nous permet de choisir des silhouettes de mots assez différentes les
unes des autres tout en gardant une longueur assez faible, n'handicapant pas
les enfants qui auraient un empan court.
Constitution des séries Puis, nous avons transformé ces mots en silhouettes en suivant la règle énoncée
dans le chapitre II (section 1).
Le nombre théorique des silhouettes différentes de mots est de 279 936 (6 puissance
7) ; car chaque lettre d'un mot de 6 lettres peut appartenir à une des 7 classes
de lettres.
Le nombre de silhouettes différentes réellement rencontrées est de 4922 (soit
1,76 % des silhouettes potentielles).
Nous avons sélectionné 4 silhouettes très fréquentes et nous avons créé 12
formes ayant les mêmes silhouettes, en respectant les répartitions des fréquences
d'apparition des silhouettes :
Exemple de mots réels
Formes créées
ananaa
avance encres excuse ananas avares
cronce avexse suance arause
banaaa
douces fausse housse tenace tousse
benacs fauces tovase henose tarosc
banana
banane douane devons ferons tenons
hancra hanove
ananab
anorak
exouaf
D'autres part, 12 formes vont être construites sur des silhouettes qui ne correspondent
à aucun mot :
Formes créées
aâaaya
césage aîsaçe
lmalan
imsieu imelau imaler iwalou lmeisn
âmâaâs
émîoïs ômésîc
émésüs âmâcés âmèsîc
Le temps de présentation de chaque forme est de 300 ms. Le temps de réponse
est laissé libre mais enregistré. L'épreuve est notée sur les 24 formes présentées
(dix autres formes étaient préalablement présentées à l'élève comme exemples
mais ne comptaient pas dans l'épreuve ; elles ne sont pas données ici).
Commentaires Critique de l'épreuve Pour résumer, un lecteur utilisant exclusivement la voie directe peut prendre
appui sur ses indices favoris dans 12 formes sur 24, alors qu'un déchiffreur
(conversion grapho-phonologique) peut prendre appui sur ses indices favoris
dans 17 formes sur 24. On peut donc s'attendre à ce que ces dernières soient
favorisées. En conséquence, pour refaire une épreuve de ce type, il faudrait
davantage veiller à ce que les silhouettes soient équilibrées, notamment du
fait que les formes impossibles doivent être prononçables.
Variables Le score des formes possibles était calculé de manière à tenir compte à la
fois de la réussite et du temps de réponse mais dans un rapport de 3 à 1 : Le score des formes impossibles était calculé de la même manière :
Par cette opération, on donnait un score centré et réduit pour chacun des types
de formes, en privilégiant le fait de bien répondre à chacun des items, mais
en pénalisant aussi les enfants lents à répondre. Nous avions donc deux scores,
montrant les performances pour les silhouettes existantes et celles pour les
silhouettes inexistantes.
Nous avons vu plus haut que la réussite sur les silhouettes existantes témoigne
d'une habileté grapho-phonologique, alors que la réussite sur les silhouettes
inexistantes montre une habileté graphique. Ces habiletés ne sont pas en concurrences.
Mais dà cause du biais que nous avons expliqué dans la critique de cette 'épreuve,
chaque compétence intervient aussi dans l'autre épreuve. En calculant une variable
"différence" : score des silhouettes inexistantes moins score des silhouettes
existantes, on annule le rôle de la compétence grapho-phonologique pour garder
ici le seul niveau de compétence graphique. On arrive donc à la variable que
nous garderons pour cette épreuve : elle témoigne de la compétence graphique
(A1).
1. Introduction *
1.1 Le modèle de FODOR (1983) *
1.2. Le modèle de JOHNSON-LAIRD (1983) *
2. Quelques travaux expérimentaux antérieurs
*
2.1. Autonomie entre la reconnaissance des mots et le contexte. *
2.2. L'importance du contexte dans la reconnaissance des mots. *
2.3. Une réflexion critique sur ces travaux *
2.4. Vision nette et vision dégradée *
2.5. La vision parafovéale et la lecture (recherches récentes) *
2.6. Quelques travaux ophtalmologistes *
2.7. La saccade occulaire. *
3. Première conclusion *
1. Une typologie des lettres en sept formes
*
2. Un essai statistique : les silhouettes des mots
de 10 lettres *
2.1 Les Mots=silhouettes (silhouettes originales) *
2.2 Les silhouettes ambiguës *
2.3 Silhouette et apparence *
3. Attentes et silhouette
*
3.1. L'horizon syntaxique. *
3.2 l'horizon sémantique *
3.3 Croisement d'un horizon sémantique et syntaxique *
3.4 Récapitulation numérique (tableau 2) *
4. Conclusions *
1. Hypothèses *
2. Méthodologie. *
1. Les enfants *
2. Les écoles *
1. Épreuve A1 : tri entre pseudo-mots, construits sur
la vraisemblance de leur silhouette *
Variables *
2. Épreuve A2 : "pendu" sur une phrase *
Variable numérique *
3. Épreuve A3 : Mots mêlés *
Variables *
4. Épreuve B1 : reconnaissance spatiale d'un mot
*
Variables *
5. Épreuve B2 : association mot->silhouette
*
Commentaires et critiques *
Variables *
6. Épreuve B3 : reconstitution de phrase
*
Variable *
7. Épreuve B4 : phrase à trou avec pièges
*
Variable *
8. Épreuve B5 : Tris syntaxiques *
Variables *
9. Récapitulation sur les huit épreuves graphiques
*
Première composante principale *
Deuxième composante principale *
Troisième composante principale *
Quatrième composante principale *
Cinquième composante principale *
Sixième composante principale *
Septième composante principale *
Huitième composante principale *
Conclusion *
1. Le modèle d'analyse. *
2. Les composantes techniques en rapport avec la performance
de lecture. *
2.1. Première contribution technique *
2.2 Deuxième contribution technique *
2.3 Troisième contribution *
2.4 Quatrième composante *
3. Conclusions *
"Comprendre consiste à imaginer et à conclure avec une rapidité et une complaisance surprenantes. Deux mots suffisent pour que nous devinions une phrase, une voyelle et deux consonnes pour que nous devinions le mot, parce que nous n'avons cessé pendant ce temps d'imaginer et de déduire" NIETZSCHE
1. Introduction
On peut décrire la lecture comme une production de significations réalisée par
un individu (le lecteur) à partir d'un texte écrit. Elle est le produit d'une
interaction entre des données contenues dans le support et les connaissances
générales du lecteur (linguistiques ET extra-linguistiques).
des données de bas niveau, qui sont les indices graphiques portés par
le texte.
des données de haut niveau, qui concernent les connaissances du sujet,
ses capacités de raisonnement, ses attentes et ses buts.
les processus ascendants, qui consistent à identifier les graphèmes,
les signifiants et à leur faire correspondre des signifiés (utilisant donc les
données de bas niveau)
les processus descendants, qui vont influencer les activités perceptives
et guider la recherche d'information (utilisant donc les données de haut niveau).
Les modèles cognitifs de la lecture supposent une interaction entre ces deux
processus. Pour distinguer ces modèles, il faut examiner la place relative qu'ils
accordent à chacune des sources de cette interaction. Qui pilote ce système
d'interaction ?
Le modèle de FODOR est un modèle "modulariste" reposant sur l'idée que "l'accès
au lexique" est insensible aux effets de contexte dans la mesure où le traitement
du langage s'effectue dans des modules séparés, n'échangeant pas d'informations
entre eux et impénétrables par les processus centraux. Ces modules sont de véritables
sous-systèmes automatiques, encapsulés, qui peuvent être étudiés en tant que
tels, indépendamment des autres modules (processeur lexical, processeur syntaxique,...).
Plusieurs travaux confortent cette hypothèse.
D'autres travaux viennent pourtant contredire les hypothèses modularistes de
FODOR et conduisent à redonner toute sa place au modèle explicatif de JOHNSON-LAIRD.
Ces travaux portent sur les processus "mécaniques" ou "intelligents" qui régissent
les mouvements oculaires (O'REGAN 1988) : ils tendraient à montrer que le point
de fixation du regard pour l'extraction de l'information pertinente serait sensible
aux effets de contexte. Autrement dit, les processus descendants auraient une
influence dans la régulation de la visée préférentielle du regard, c'est-à-dire
avant l'identification des mots. D'autres travaux, sur la lecture d'énoncés
comportant des ambiguïtés lexicales, vont dans le même sens apportant des arguments
en faveur d'un modèle interactif (DUBOIS & AUBRET 1988).
Les recherches sur la lecture, dans le champ de la psychologie expérimentale,
sont nettement séparées en deux domaines, n'ayant que peu de rapport l'un avec
l'autre :
un secteur où l'on s'intéresse aux processus de perception des mots et à l'accès
au "lexique"
un autre secteur où l'on étudie la compréhension, à travers l'analyse de l'intégration
sémantique, de l'inférence ou de la représentation.
Les recherches ayant le plus d'écho en France, dans certains milieux pédagogiques,
sont actuellement celles menées par le laboratoire de psychologie expérimentale
de l'Université libre de Bruxelles, sous la houlette de J.Alegria et J.Morais.
Nous l'avons déjà mentionné, cette équipe dissocie la perception des mots de
la compréhension de ceux-ci. Il s'agit d'une séparation temporelle (on identifie,
puis on traite cette information) ; c'est de fait une séparation cérébrale :
la forme écrite doit activer un signifiant dans " un lexique interne où les
mots qu'il [le lecteur] connaît, sont stockés de manière relativement stable.
Ce lexique lui permet de comprendre et de produire le langage, tant écrit qu'oral.
" (ALEGRIA, 1991). Cet auteur apparente le rôle du contexte (dans le sens où
celui-ci produirait une activation des entrées lexicales qui ont un rapport
avec lui) aux phénomènes d'" amorçage sémantique ". Ces travaux, très nombreux
dans ce champ, montrent que l'identification d'un mot active un domaine sémantique,
et que la reconnaissance d'un mot présenté ensuite dans un laps de temps très
court (environ 30 ms) sera bien plus rapide si ce deuxième stimulus appartient
au même réseau sémantique. Alegria ne considère pas que ce processus soit de
quelque utilité dans la lecture véritable, car l'activation reste trop attachée
à un réseau activé par la présence d'un mot. Pourtant, Sereno montre comment
une amorce sémantique peut aussi être activée par une phrase entière (SERENO,
1992), tout en rappelant des études antérieures allant dans ce sens (SCHUBERT,
1977). L'étude de Sereno, portant spécifiquement sur les effets d'amorçage sémantique
introduits par une phrase, démontre clairement que cet amorçage existe bien
pendant un temps très court (28-31 ms) ; cette courte durée de vie (Sereno a
montré qu'il disparaissait après 40 ms), surtout quand cet amorçage n'est rappelé
qu'à partir d'influences lexicales, permet bien souvent de nier le rôle du contexte
dans la lecture.
des temps de travail sur les mots ambigus plus longs pour les contextes antérieurs
négatifs que positifs ou neutres (parce que le "processeur" devra y faire une
pause pour attendre que le sens secondaire soit activé)
des temps de travail plus longs sur des contextes postérieurs de mots ambigus
dans des situations antérieures positives ou neutres (parce qu'il y sera fait
le recalcul de sens du mot ambigu)
Malgré le poids important du modèle modulariste, de nombreux travaux viennent
contredire cette thèse.
un temps de travail sur les mots ambigus plus long pour les contextes négatifs
que pour les contextes neutres.
un temps de travail sur les séquences désambiguïsant les contextes positifs
et négatifs plus court que pour les contextes neutres (il n'est pas nécessaire
de recalculer le sens parce que le contexte l'a "pré-levé").
Toutes ces recherches de laboratoire de psychologie appellent quelques commentaires
plus généraux.
Chez l'Homme, la fovéa, petite dépression d'environ 1,2 mm de diamètre située
au centre de la tache jaune ou macula, se caractérise par une grande finesse
dans son pouvoir de discrimination spatiale, ainsi que par son importance pour
la vision des couleurs. Elle contient exclusivement des cônes, tous les éléments
non récepteurs ainsi que les vaisseaux sanguins étant refoulés à sa périphérie,
ce qui a l'avantage de laisser la lumière frapper directement les récepteurs.
Leur densité est très élevée. Chaque cône est connecté à une cellule bipolaire.
Au fur et à mesure qu'on s'éloigne de la fovéa, les cônes deviennent plus rares
; les bâtonnets progressivement prédominent. Ici, les prolongements dendritiques
des cellules bipolaires font contact avec un nombre important de bâtonnets.
Nous allons maintenant évoquer le rôle des informations parafovéales sur le
temps de fixation de l'œil.
Quelques équipes de recherche se sont particulièrement spécialisées dans l'étude
de la prise parafovéale d'informations dans la lecture. La question est ici
de savoir le rôle exact du mot à droite (donc dans la zone parafovéale) du mot
fixé qui se trouve, lui, dans la zone fovéale. Depuis 1981 et les travaux de
Rayner, on sait que si on retire des informations (par des systèmes de masques)
de la zone parafovéale, la vitesse de lecture décline d'environ un tiers. Cette
réduction de vitesse est due à l'accroissement des temps de fixation, à des
saccades oculaires plus courtes, et à un plus grand nombre de fixations. Les
informations sur les mots, obtenues par une vision parafovéale, facilitent l'identification
du mot suivant (INHOFF & RAYNER, 1986). On peut se demander quels sont les modes
d'action de cette prise d'informations. D'après Inhoff (INHOFF, 1982), il paraît
improbable que la vue parafovéale active directement une attente sémantique
qui accélérerait la reconnaissance du mot. Pour preuve, les bénéfices habituellement
observés dus à la vision parafovéale disparaissent si, lors du déplacement de
l'œil sur le mot suivant, on remplace celui-ci par un mot sémantiquement proche.
Précisons que l'œil ne prend pas d'information pendant le déplacement (BERTHOZ,
1996), ce qui justifie le choix du moment où on modifie le mot suivant.
Le laboratoire de recherche sur la vision de l'Université du Minnesota a entrepris
des recherches pour comprendre les conséquences sur la lecture de la perte de
champ visuel. Ces travaux retiennent l'attention, tant il apparaît que l'ensemble
de l'œil participe à la lecture, et pas seulement la fovéa. G.LEGGE et son équipe
ont développé un modèle informatique d'observation et de simulation de la lecture,
nommé Mr Chips. Ils ont évalué les performances en lecture en fonction de la
taille de l'empan visuel, c'est-à-dire du nombre (N) de caractères adjacents
qui pouvaient être reconnus. La tâche de Mr Chips était de se mouvoir dans un
texte en un nombre minimum de saccades, tout en identifiant tous les mots. Deux
sources d'informations étaient disponibles pour Mr Chips :
Des données lexicales, les mots possibles et leurs fréquences. Un peu comme
des données de haut niveau…
Les quatre schémas suivants montrent l'effet de la perte d'information due à
une amputation d'une partie périphérique du champ visuel.
lecteur n'est pas perturbé par des masques.
On remarque également que plus le nombre de lettres (N) (largeur de l'empan)
est élevé, moins les connaissances lexicales sont utiles. Les données purement
graphiques augmentant en proportion de la taille de l'empan considéré, les phénomènes
logographiques pourraient intervenir de façon plus importante que ce qui est
communément admis. Nous reviendrons sur ce point dans le chapitre II.
Il est régulièrement fait état de l'étude des saccades oculaires dans la lecture.
Mais ce phénomène est aussi un objet d'étude physiologique ; on l'observe dans
les différentes aires corticales et dans le cerveau profond. Son étude est d'une
trop grande complexité pour être véritablement traitée ici, néanmoins nous allons
évoquer quelques points.
On le voit, toutes ces recherches sont loin d'avoir épuisé le domaine. Au contraire,
les multiples spécialités (psychologie, neurologie, ophtalmologie, neurophysiologie,
pédagogie) renforcent un peu plus la complexité de la question de la lecture,
d'où la nécessité de recouper les informations de toutes les disciplines.
Revenons sur l'évidente contradiction entre la plage de netteté de la vision,
plage définie par des contraintes physiologiques très stables, et la plage de
lecture, décrite comme la quantité d'écrit séparant deux fixations, plage très
variable selon la compétence du lecteur. C'est précisément ce non-recouvrement
de l'empan visuel (vision nette au sens de Legge, étudié dans le chapitre I)
et de l'empan de lecture qui permet de questionner les processus psychologiques
à l'œuvre chez le lecteur.
volontiers
nalanblana
graduation
ynabnablan
malheureux
malbannann
échafauder
âababanban
échiquiers
âablynlana
dangereuse
banyananaa
trouveront
bnannenenb
Le tableau 1 donne la répartition générale. On le lit ainsi : 18 987 silhouettes
(soit 68.83 % des silhouettes) contiennent 1 mot, ce qui représente 18 987 mots
(soit 47.59 % des mots de 10 lettres) ; 6 547 silhouettes (soit 23.73 % des silhouettes)
contiennent 2 mots, ce qui représente 33 % du corpus, ...
Le signe (=) est ici une convention volontaire.
Les 20 909 autres mots de 10 lettres se répartissent entre 8 597 silhouettes.
Avec eux, le codage par 7 archi-signes n'est pas aussi discriminant que l'est
le codage long (38 caractères). Plus du tiers des silhouettes(6 547) ne correspondent
toutefois qu'à 2 mots qui sont, le plus souvent, deux déclinaisons du même mot
souche (par exemple, disgracier et disgraciez). Les 2 050 silhouettes recouvrant
au moins 3 formes se répartissent comme en figure 9 :
Pour ces 20 909 formes, il est donc évident que la silhouette ne suffit pas
à différencier le mot, du moins si les silhouettes apparaissaient de manière
totalement aléatoire.
Les informations complémentaires auxquelles il semble naturel de songer sont
les lettres elles-mêmes dans la mesure où, au cours de la fixation visuelle,
2 ou 3 vont être perçues nettes au centre de l'empan de lecture. On peut tenter
de simuler l'information réellement disponible, pour différencier des mots ayant
même "silhouette", lorsque la fixation visuelle a lieu en leur centre.
D'autres informations sont donc incontestablement nécessaires. On peut même
se demander si ces "autres" informations ne sont nécessaires que pour désambiguïser
des différenciations douteuses ou si ces autres informations sont de toute façon
constitutives du processus interactif ? En effet, nous avons fait jusqu'ici
comme si l'apparition d'un mot sous les yeux d'un lecteur était un événement
isolé, isolé d'autres mots, isolé d'un contexte de sens. Dans la perspective
interactionniste, il est évident que, simultanément à ces informations graphiques
(de bas niveau), existent des informations de haut niveau, qui ont rarement
fait l'objet d'investigations tant elles participent du discrédit actuel stigmatisé
par la "devinette psycho-linguistique" (GOODMAN, 1967). Sans faire preuve d'une
grande audace, on peut supposer, pour commencer, que ces informations intervenant
dans la lecture du mot suivant viennent au moins de deux horizons, un horizon
syntaxique et un horizon sémantique.
On trouve très peu de mots dans un texte qui sont imprévisibles ou totalement
prévisibles sur le plan grammatical. Dans la simulation informatique que nous
faisons, nous informons l'ordinateur sur la catégorie grammaticale du mot qu'il
rencontre sous la forme de silhouette. Dans quelle proportion la prise en compte
de la catégorie grammaticale réduit-elle l'ambiguïté d'une silhouette ? Dans
le domaine désormais familier des mots de 10 lettres, on se souvient que sur
un total de 39 896 formes, 18 987 sont déjà parfaitement différenciables en
tant que silhouettes. Le nombre de mots différentiables passe de 18 987 à 21
307 si on ajoute la catégorie grammaticale à la silhouette, soit un gain relativement
faible de 2 320 mots. Il reste encore 18 589 mots ambigus répartis entre 8 220
" silhouettes grammaticales " (à la fois une silhouette et une catégorie grammaticale).
En bref, la prise en compte de la nature grammaticale désambiguise 2 320 mots
mais réduit de très peu (577 sur 8 597) le nombre de silhouettes multiples.
Il est évident, nous y avons déjà fait allusion, que ces recensements concernent
la totalité des mots de 10 lettres sans tenir compte de leur fréquence dans des
écrits réels. Il est à peu près certain (mais nous ne l'avons pas chiffré) que
la majorité des silhouettes ambiguës regroupe massivement des formes fléchies
d'un même mot, telles que indulgents et indulgente ou gourmander et gourmandez,
etc. Si bien qu'en situation dans un texte, ces mots seraient différenciés aisément
par une précision syntaxique portant sur un déterminant ou une personne verbale
presque toujours présent au sein de l'empan de lecture lui-même.
Ce travail a en commun avec celui de LEGGE de prendre appui sur une simulation
informatique. Il partage aussi quelques conclusions importantes, notamment sur
la nécessité d'ajouter des informations de haut niveau pour compenser la perte
d'informations de bas niveau, perte liée à la dégradation en vision parafovéale.
On peut se demander si les résultats de LEGGE n'auraient pas été encore plus
nets s'il n'avait pas représenté cette dégradation de manière uniforme par une.
Je pense que l'hypothèse de silhouettes rend mieux compte de cette dégradation
qui ne se réduit pas à du tout ou rien. Mais, dans les deux expériences, ce
qui ressort, c'est un approfondissement de ce concept d'interaction qui vient
de la nécessité d'apporter des informations de haut niveau pour pouvoir tirer
parti d'informations dégradées, lesquelles ne relèvent évidemment plus d'une
transformation de type grapho-phonologique. C'est bien des signifiants visuels,
de nature graphique, qu'il faut traiter et qui n'ont pas d'existence phonologique
avant d'avoir acquis le statut de signifié.
1. Hypothèses
Il est peu satisfaisant de considérer le fonctionnement cérébral comme étant
la réplique de celui d'un ordinateur alors que notre particularité est d'agir
par rapport à un but, à une intention. Pour l'ordinateur, agir c'est appliquer
un algorithme ; pour l'homme, c'est produire cet algorithme. Il faut espérer
que le fonctionnement, encore mal connu, de la "machine proactive" chère à Berthoz,
va nous réserver encore des surprises. Quoiqu'il en soit, on peut dire aujourd'hui
que le cerveau traite en un instant, simultanément et non successivement, une
grande quantité d'informations et que c'est sur cette simultanéité d'entrées
que procède l'intelligence. Il n'y a pas de raison pour supposer que cette façon
de faire ne se retrouve pas dans l'acte de lecture.
Le groupe d'enseignants et de chercheurs dont j'ai parlé dans l'introduction
a fait passer huit épreuves à une cohorte d'enfants de 11 ans suivis depuis
la Grande Section de maternelles. Ces huit épreuves ont été construites dans
le but d'explorer le champ supposé des compétences techniques vis-à vis de l'écrit
hors d'une situation de lecture. Pour chacune d'elles, un score qui tente de
quantifier ce qui a semblé être la manière efficace de réussir l'exercice proposé
a été établi. Pour des raisons évidentes à l'échelle d'une population d'enfants
de 11 ans, le nombre des épreuves est limité même s'il faut tenter de couvrir
un champ technique incertain et vaste correspondant aux hypothèses recensées
dans la littérature sur cette question. Quelles compétences observer ? Le savoir
supposerait les recherches abouties et donc celles-ci inutiles. Et comment savoir
que tel exercice permet d'évaluer telle compétence ? Est-il même concevable
que la solution d'une situation-problème dépende de l'exercice d'une seule compétence
à la fois ? Il est probable, au contraire et même si la conception d'un exercice
vise à le spécifier par rapport à une compétence technique supposée, que son
résultat va témoigner de compétences différentes, parfois insoupçonnées au départ
et toujours dans des proportions inconnues. L'écrit est un matériau que sa fréquentation
rend tellement polymorphe qu'il est assuré que sa rencontre fait appel dans
le même instant à plusieurs savoir-faire. L'autonomie des compétences est une
hypothèse de travail pour les chercheurs mais qu'en est-il pour les lecteurs
? Il semble donc prudent de ne surtout pas définir les compétences techniques
par les épreuves techniques qui ont été proposées.
- avoir une corrélation linéaire nulle avec la première
- avoir, à son tour, la plus grande variance.
1. Les enfants
Comme annoncé, nous utilisons des observations faites dans une cohorte déjà
constituée.
- 8 (14 %) [11 (14%)] sont issus de catégories socio-professionnelles aisées
(cadres, professions libérales,...)
- 20 (34 %) [28 (37%)] sont issus de catégories socio-professionnelles moyennes
(techniciens, agents de maîtrise, petits commerçants...)
- 31 (53 %) [37 (49%)] sont issus de catégories socio-professionnelles modestes
(ouvriers, employés,...).
{KHI-2 = 0,2 ; dll = 2 ; P = 90.5%}
Les élèves sont tirés de 17 classes implantées dans 11 écoles. Quarante-trois
[53] de ces enfants sont issus de douze classes dont les instituteurs faisaient
tous partie d'un même mouvement pédagogique, l'Association Française pour la
Lecture. Leur pédagogie, commune en théorie, donne priorité à la compréhension
de textes écrits dès le début de l'année scolaire, et n'accorde qu'une place
minime à l'enseignement du système de correspondance grapho-phonologique.
5 [8] enfants dans l'école n°1 : Le Lac
8 [9] enfants dans l'école n°2 : Les Buttes
6 [8] enfants dans l'école n°3 : Les Charmes
4 [5] enfants dans l'école n°4 : J. Prévert
8 [9] enfants dans l'école n°5 : Marie Noël
5 [5] enfants dans l'école n°6 : La Montagne
2 [4] enfants dans l'école n°7 : Nestor Perret
5 [5] enfants dans l'école n°8 : Aristide Briand
5 [7] enfants dans l'école n°9 : Edgar Quinet
7 [10] enfants dans l'école n°10 : Alphonse Daudet
4 [6] enfants dans l'école n°11 : Nébouzat
{KHI-2 = 1,01 ; dll = 10 ; P = 99.9%}
Dans ce chapitre, nous décrivons les huit épreuves standardisées, créées pour
décrire des compétences techniques et, notamment, tenter de cerner celles qui
se sont forgées, à travers la lecture et son apprentissage, au contact des caractéristiques
graphiques de l'écrit. Nous les appellerons, avec l'espoir de mieux les décrire,
des compétences graphiques.
Toutes les épreuves dont il va être fait mention se sont déroulées dans des
conditions normalisées.
- Les épreuves se déroulaient en deux séances d'une heure, réparties sur deux
jours.
- Chaque épreuve commençait par un certain nombre d'exemples : pour ménager
un temps d'apprentissage, la réponse ne comptait pas dans les résultats. Le
premier exemple permettait toujours à l'expérimentateur de stopper le déroulement
pour s'assurer de la bonne compréhension de l'exercice.
- Six expérimentateurs se sont déplacés pour rencontrer les élèves de la cohorte
initiale dans les seize écoles. Ces six expérimentateurs avaient fait passer
les mêmes épreuves à des sujets ne faisant pas parti de la cohorte, et s'étaient
réunis avant de commencer pour normaliser les modalités exactes de passations
; ces modalités étaient écrites.
- Trois épreuves (A1, A2 et A3) ont toutes été passées le premier jour, cinq
épreuves (B1, B2, B3, B4 et B5) l'ont été le deuxième. L'ordre de passation
était imposé.
- Ces épreuves sont présentées sur l'écran d'un ordinateur (tous les ordinateurs
avaient des écrans de 14 pouces, réglés dans la résolution 640*480). Les élèves
en connaissaient le maniement, même si, ici, les tâches informatiques s'avéraient
rudimentaires.
- Sur certaines épreuves, c'est l'expérimentateur qui valide les réponses.
La première des épreuves consiste à classer des formes composées de lettres
et qui apparaissent au centre de l'écran, prenant la place d'un point de fixation.
C'est volontairement que nous ne parlons pas ici de mots car ces formes ne correspondent
pas à des mots qui existent actuellement en français et nous ne comprenons pas
ce que sont des pseudo-mots ou des non-mots. Deux types de formes apparaissent
: celles qui peuvent exister parce qu'elles ressemblent à celles de mots qu'on
peut voir en français, et celles qui ne correspondent à aucune forme de mots
français. L'enfant répond en utilisant respectivement la touche 1 ou 3 du pavé
numérique.
Pour fabriquer ces deux listes de pseudo-mots, nous sommes partis des 15253
mots de 6 lettres générés par la base à partir des 39896 mots-souches de cette
même base (ces souches génèrent 263 041 mots déclinés).
On comprend bien qu'on est ici dans le souci de cerner de plus près la "conscience
graphique". Les épreuves sur les pseudo-mots sont d'ordinaire proposées pour
décrire la maîtrise du décodage, pour observer le rôle de la conscience phonologique
dans la décision d'appartenance ou non au lexique ; voir par exemple les techniques
d'Amorçage Sémantique Médiatisé par la Phonologie (ou ASMP) (PAIRE-FICOUT, 1996)).
Les pseudo-mots sont aussi utilisés pour mesurer la familiarité de trigrammes
(GOIGOUX, 1993). Ici, on franchit encore un pas : par exemple, le trigramme
eqr n'existe pas mais il a la même silhouette que le trigramme opu, qui, existe.
Autrement dit, certaines formes créées ne pourraient pas exister du fait des
trigrammes qu'elles contiennent mais elles peuvent exister car leur silhouette,
au-delà des strictes lettres qui les composent, existe. L'objectif est bien
de discerner une silhouette qui peut exister, habillée par un mot qui n'existe
pas, que ce mot se prononce ou pas. Un lecteur habile connaît-il les silhouettes
communes par sa vision parafovéale, donc au-delà des lettres ? Même si elle
n'existe plus en vision centrale, l'habitude de traiter cette structure spatiale
(gestalt) devrait favoriser sa reconnaissance rapide. Cette habileté à repérer
des silhouettes fréquentes est, de fait, annoncée par certains travaux (INHOFF,
1986) qui montrent, pour la vision parafovéale, un net bénéfice quand il s'agit
de mots fréquents, donc de silhouettes fréquentes. Cette volonté de repérer
une conscience graphique abstraite est augmentée encore, dans cette épreuve
A1, par le temps de présentation extrêmement bref.
Nous avons bâti nos deux listes de formes à partir de leur catégorisation en
silhouette. Mais un point nous a échappé, ou du moins était moins clair à l'époque,
dans la constitution de ces listes : on remarque, à la lecture à voix haute,
que les 12 formes possibles peuvent se prononcer mais que 5 formes impossibles
posent aussi des problèmes de prononciation (imsieu, émîoïs, ômésîc, émésüs,
âmèsîc). D'autre part, 4 formes possibles ont une silhouette rare alors que
8 formes impossibles ont une silhouette rare. On peut donc penser qu'il est
plus facile à un individu qui passe par la "médiation phonologique" (voie indirecte)
de repérer les formes possibles, alors qu'il sera plus facile à un individu
n'employant que des indices visuels (voie directe) de repérer les formes impossibles.
Dans un premier temps, nous avons construit deux variables qui travaillaient
les formes possibles et impossibles. Toutes les données brutes qui ont servi
ont été centrées et réduites.
Score = (trois fois le nombre de bonnes réponse) moins (le temps mis pour répondre),
le tout divisé par l'écart-type de la distribution résultante, afin d'avoir
un score dont l'écart-type égale 1.
Moyenne 0,00
Écart-type 1,00
A1 : Plus Value graphique. |
|
Moyenne |
0,00 |
Erreur-type |
0,21 |
Médiane |
0,18 |
Mode |
1,16 |
Écart-type |
1,60 |
Plage |
8,39 |
Maximum(1) |
4,02 |
Minimum(1) |
-4,37 |
En bref, avoir un bon score dans cette épreuve A1 est à mettre au compte de la mobilisation d'une expérience graphique, d'une compétence graphique dans une tâche de décision lexicale au niveau du mot, sans référence à un contexte.
2. Épreuve A2 : "pendu" sur une
phrase
Dans cette épreuve, on présente un court texte et on demande de retrouver la
phrase qui suit ce texte. Cette phrase est présentée suivant son gréement, c'est-à-dire
en remplaçant chacune des lettres par un point. Voici un exemple de texte présenté,
ainsi que la phrase à compléter (c'est ici la phrase servant d'exemple) :
Texte |
C'était devenu un geste instinctif : chaque fois que je rentrais de l'école, je balançais mon cartable dans un coin. |
Phrase |
· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ‘· · · · · · · · . |
qui correspond à : |
Je courais rejoindre mes copains au bas de l'immeuble. |
j b k q f x g z
m n v
d
p
c ç
t
s
l
r
o
u
a à
i
e é è
Si, lors de la première demande, la phrase à trouver contient deux f et un j, ces trois lettres seront écrites sur l'écran à leur place respective.
L'ordre de la liste a été choisi en sens inverse de la fréquence des lettres en français ; donc en commençant par les consonnes les plus rares. Les indices graphiques les plus forts pour trouver la bonne phrase sont les lettres rares, en conséquence les consonnes. On retrouve ici certains faits déjà exposés dans Hyönä (HYONA, 1995) : les combinaisons de lettres rares seraient saillantes dans la vision parafovéale. En conséquence, avoir conscience du gréement orthographique pourrait influer sur les performances de lecture. C'est ce que cette épreuve tente de montrer.
Ce qui va différencier les élèves, c'est uniquement le nombre de lettres demandées et, dans une moindre mesure, le temps mis pour trouver la bonne réponse. Ainsi, le choix que nous avons fait de ne pas afficher d'abord les voyelles pourrait discriminer les lecteurs ayant une bonne conscience graphique, une bonne conscience de la structure consonantique du français écrit.
Après le texte d'exemple, 5 phrases sont évaluées :
Phrases à trouver |
|
J’extirpais mon pied de sa chaussette. Mon copain se tenait déjà au pied de l'escalier branlant, tout au bord du barrage, avec l'eau jusqu'aux chevilles. Je remontais mes bas de pantalon. |
Puis je ramassais baskets et chaussettes, et le suivis. |
Un jour le géant, pour jouer un peu, lui propose un pari. |
Cent pièces d'or pour celui qui enverra la toupie le plus loin. |
Bonaparte part en expédition en Egypte. Il est accompagné de savants. Le capitaine Bouchard découvre un fragment de stèle. |
La découverte est sensationnelle et Bonaparte félicite son capitaine. |
Les hommes de l'Antiquité utilisaient l'argile pour façonner des tablettes. Ils taillaient les tiges de roseau en pointe. |
A l'aide de ces pointes de roseaux ils traçaient des dessins. |
Les rayons du soleil brûlent cruellement la peau des rhinocéros. Ils s'avancent et plongent dans la boue à la recherche de fraîcheur. |
Les animaux se retrouvent prisonniers, enfoncés dans la vase. |
On peut d'abord être étonné que ce nombre moyen de demandes soit si élevé puisqu'il
ne reste ensuite que 3 recours possibles à une aide. Les 11 lignes demandées
en moyenne fournissent 21 lettres. Ainsi, en reprenant l'exemple de la phrase
de présentation, la réponse sera trouvée, en moyenne, seulement au-delà de cet
affichage :
J* cour**s r*jo*ndr* m*s cop**ns *u b*s d* l'*mm*ubl*.
Il reste 15 lettres cachées sur les 44 de la phrase, donc encore plus du tiers,
ce qui est finalement considérable, au contraire de l'impression initiale. Quelles
compétences se trouvent alors à l'œuvre dans cette résolution de problèmes ?
On trouve seulement deux syllabes constituées et prononçables (sur les 15 de
la phrase) mais aucun mot achevé. Une structure quasiment consonantique comme
celle de l'arabe littéraire. À l'exception de deux élèves, tous ont au moins
besoin de neuf apports : les neuf lignes initiales de la liste fournie, soit
toutes les consonnes. L'accès au sens se fait par un travail effectué à partir
des indices disponibles qui ne donnent pas accès à des formes orales.
- la deuxième donnée utilisée est le temps moyen pour aboutir à l'identification
d'une phrase. (en secondes)
Moyenne 115,08
Écart-type 59,06
La prise en compte du temps est un élément important du fait même du déroulement de l'exercice. En effet, on peut trouver la phrase en demandant très vite la totalité des lettres, ou en réfléchissant longtemps afin d'économiser l'affichage de lettres nouvelles. On peut aussi trouver rapidement avec peu de lettres, ce qui représenterait ici la meilleure réussite.
C'est pourquoi il est souhaitable de synthétiser les deux informations dans un score unique d'efficacité (A2). Comme pour A1, après avoir centré et réduit les deux variables précédentes, on calcule A2 par la formule :(moins trois fois le nombre de lettres demandées) moins le temps. Les stratégies d'élucidation tournent ici vraisemblablement autour de confrontations entre des entrées sémantiques (la phrase inductrice, la forme syntaxique de la phrase, etc.) et des entrées visuelles ou graphiques à travers des mots que suggèrent les formes. La réussite à cette épreuve pourrait témoigner d'une compétence technique centrée sur du sémiographique en contexte et au niveau de la phrase et du texte.
Score A2. |
|
Moyenne |
0,0 |
Erreur-type |
0,14 |
Médiane |
0,13 |
Écart-type |
1,04 |
Plage |
5.98 |
Minimum |
-2,59 |
Maximum |
3,59 |
3. Épreuve A3 : Mots mêlés
Il s'agit ici de retrouver le plus vite possible le mot français le plus long
qui se cache dans une suite de lettres affichées à l'écran (le mot n'étant pas
en désordre au sein de la suite). La réponse est donnée en tapant le mot au
clavier, le groupe de lettres n'étant plus visible. On a trois essais par mot,
au maximum.
groupe de lettres |
Mot à trouver |
almarcheronsdelle |
marcherons |
elyvolibrement |
librement |
enusousamrine |
sous |
aidoigtalismnes |
doigt |
Cette épreuve pose un problème. On connaît depuis les travaux de Reichter en 1969, l'"effet-mot" : un mot sera mieux identifié que les lettres qui le composent de façon séparée. On supposa alors que c'est la perception du mot qui influence la reconnaissance des lettres, et non l'inverse. Notons qu'on peut interpréter les données de Inhoff (INHOFF, 1989) sur la perception de mots en vision parafovéale comme pertinente avec l'effet-mot. De plus les travaux de Posner (POSNER, 1978) montre l'importance de l'organisation des lettres en mot comme participant du processus visuel. Or, dans l'épreuve A3, on prend la question à l'envers. En effet, en lecture, le mot est une unité saillante, visible par les séparateurs qui l'entourent toujours. Ici, il n'y a pas de séparateurs entourant les mots.
Dans la suite de lettres "almarcheronsdelle", en accord avec les écrits sur l'importance des espaces dans la reconnaissance de mot, le mot le plus prégnant se situe à la fin " elle ". Ce n'est pas celui qui est le plus long, il faut donc reprendre du début, et procéder à un découpage syllabique, puis à de l'assemblage : marche + r + ons = marcherons (tout cela après avoir éliminé un éventuel mot .commençant par le trigramme alm (almanach ou almée s'élimine rapidement). On est donc dans une épreuve qui ressemble à ce que nous avons écrit sur le modèle autonomiste (FODOR, 1983), où on perçoit, on assemble, puis on décide si ça existe, tout cela hors contexte. En conséquence, réussir à cette tâche demande la réalisation d'un processus de type combinatoire, sur des unités syllabiques, et de l'assemblage de sous-unités, hors contexte.
Variables
Même après avoir émis quelques réserves quant à la parenté de cette épreuve
avec la lecture réelle, nous allons présenter ses résultats. Deux variables
ont d'abord été retenues :
- le nombre de réponses correctes (sur 4)
Moyenne 3,2 mots
Écart-type 0,8
On remarque la très bonne réussite, avec une moyenne de 3.2 mots trouvés et
un écart-type assez faible. Cela semble corroborer nos remarques précédentes.
- le temps moyen mis quand on donne une bonne réponse
Moyenne 29,79 secondes
Écart-type 22,5
- Finalement, nous avons construits une variable unique qui tient compte du
moment où la réponse est apparue. C'est le score de qualité pour les mots
mêlés (A3). Elle est calculée de la façon suivante :
Pour chaque mot, on attribue :
1 point pour une réponse correcte au premier essai
2 points pour une réponse correcte au deuxième essai
3 points pour une réponse correcte au troisième essai
6 points pour un échec
On fait le total des points. Comme il y a quatre mots à trouver, avoir 4 est le signe d'une très bonne réussite, alors que 24 points montre un échec total. Ce résultat (X) est ensuite centré et réduit (X moins la moyenne ; le résultat est divisé par l'écart-type). Enfin le signe est inversé afin que la réussite ait un score plus élevé que l'échec (simple problème de lisibilité des données ensuite).
Moyenne |
0,00 |
Erreur-type |
0,13 |
Médiane |
-0,03 |
Mode |
-0,03 |
Écart-type |
1,0 |
Plage |
4,29 |
Minimum |
-3,06 |
Maximum |
1,23 |
4. Épreuve B1 : reconnaissance spatiale
d'un mot
Cette épreuve, B1, s'inspire du jeu "Scrabble". Il faut remettre en ordre le
plus vite possible toutes les lettres affichées à l'écran, pour former un mot
français. Les lettres sont affichées de manière désordonnée (mais identique
pour chaque élève). Huit mots étaient à retrouver (malade, barrer, forces, partir,
manger, roseau, bleues, écrire). Il n'y a qu'une seule solution par projection
de lettres.
On aurait voulu rechercher ici une éventuelle compétence graphique à l'œuvre dans la reconnaissance spatiale d'un mot. Est-ce que l'ensemble des lettres d'un mot est en relation avec le mot, évoque ce mot même quand elles ne sont pas ordonnées ? Il semble, au contraire, que pour bien réussir à cette épreuve, il faut être capable de tâtonner rapidement des mises en ordre de lettres pour former des syllabes et des mises en ordre de syllabes pour former des mots. En bref, une sorte de fusion d'éléments simples avant et après la syllabe, à base de correspondance grapho-phonologique, sans référence à un contexte sémantique ou grammatical : c'est là tout l'art de la combinatoire. Ce travail fait aussi appel à la richesse linguistique de l'enfant.
Nous avons pris en compte, dans cette épreuve, la réussite et le temps mis
pour la mener.
Variables
V9 score global Scrabble (B1). Il est calculé de la manière suivante. Pour chacun
des mots, on attribue :
si réussite en moins d'une minute 2,4 pts
si réussite en moins de 2 minutes 1,8 pts
si réussite en moins de 3 minutes 1,2 pts
si échec 0 pts.
Le score final est la moyenne des points (sur les huit mots évalués).
Score global Scrabble |
||
Moyenne |
1,27 |
|
Erreur-type |
0,06 |
|
Médiane |
1,20 |
|
Mode |
1,20 |
|
Écart-type |
0,44 |
|
Plage |
1,95 |
|
Minimum |
0,45 |
|
Maximum |
2,40 |
5. Épreuve B2 : association mot=silhouette
Un mot isolé est présenté à l'écran, pendant un temps très court (250ms). Il
faut décider de l'affectation de ce mot présenté à une silhouette, à choisir
parmi 3 silhouettes proposées ou bien l'attribuer à la catégorie AUTRE.
Voici le lot des silhouettes. L'expérience est répétée pour 26 mots. Le tableau suivant donne l'épreuve en clair.
les 3 silhouettes |
Les 26 mots présentés |
banna |
benne bonne bravo brune dures durez faces faons farce fours fusas fuser |
bnabe |
bruts daube farts faste forte |
yanba |
gonds jacta juste parka pendu perds pesta |
autre |
nages orque |
Variables
Plusieurs données brutes étaient recueillies pour cette épreuve :
- le temps moyen pour donner une réponse, quelle qu'elle soit.
Moyenne 4,07 secondes
Écart-type 1,33
- temps moyen pour donner une bonne réponse
Moyenne 4,08 secondes
Écart-type 1,33
- le temps moyen pour donner une mauvaise réponse
Moyenne 3,92 secondes
Écart-type 1,79
On remarque le temps assez long pour répondre. On est loin d'une procédure automatisée. Les mauvaises réponses demandent un temps de réponse légèrement plus faible, comme si le temps de réflexion que l'on s'accorde améliore la réponse. Cela va dans le sens d'une résolution de problème plutôt que dans celui d'une réponse graphique.
Finalement, nous ne retiendrons qu'une seule variable, sans prendre en compte
le temps mis. C'est :
- le nombre total de bonnes réponses aux 3 types de silhouettes. (B2)
Score B2 |
||
Moyenne |
18,32 |
|
Erreur-type |
0,48 |
|
Médiane |
19 |
|
Mode |
19 |
|
Écart-type |
3,73 |
|
Minimum |
5 |
|
Maximum |
23 |
6. Épreuve B3 : reconstitution de
phrase
L'épreuve rappelle un peu l'épreuve B1. Au lieu de lettres, les unités présentées
ici sont des mots ; et il s'agit de reconstituer une phrase. Tous les mots en
font partie. Huit phrases sont à trouver ; le temps est important dans la réussite
à l'épreuve.
Phrases présentées :
Certains ne supportent pas le soleil sans lunettes.
Il y a des marées exceptionnelles deux fois par an.
Les jeux de ballon sont interdits dans la cour.
Je ne peux pas prendre mon vélo parce qu'il a un pneu crevé.
A ce jeu de dés, celui qui a 6 peut rejouer.
La grippe et l'angine donnent souvent beaucoup de fièvre.
Son réveil n'a pas sonné et il a raté son train.
Il faut se méfier des chiens qui n'aboient pas.
Sont ici probablement sollicitées :
la qualité de la reconnaissance des mots isolés mais cette fois, pour leur valeur
de signifié, voire même dans la polysémie de ce signifié
une capacité syntaxique,
- avec le besoin de prendre comme point d'entrée le mot ayant une majuscule
- avec la nécessité de partir à la recherche d'un sujet en rapport à l'accord
du verbe
- le besoin de reconnaître l'expansion possible des groupes nominaux (adjectifs…).
Une fois résolu le problème de l'entrée de la phrase (à l'aide d'un indice
purement graphique : la majuscule), le contexte se construisait au fur et à
mesure de la résolution du problème. Si le premier mot est au pluriel, Certains,
le seul mot qui est aussi au pluriel est lunettes mais le genre ne correspond
pas : Certains sera donc un pronom indéfini sujet. La connaissance du système
de la négation oblige à placer ensuite l'adverbe ne, puis le verbe (un seul
est proposé) suivi de l'autre adverbe pas : à ce stade, le contexte est déjà
très fort puisqu'on est devant la structure :
Certains ne supportent pas + lunettes + le sans + soleil
Reste à placer l mots mais, ici, la solution saute aux yeux… pour des raisons
sémantiques.
On est donc devant la mise en place d'un raisonnement et d'une résolution
de problème au niveau syntaxique et sémantique, dans une unité phrastique.
Variable
score global de réussite à la mise en ordre de phrases qui est calculé de la
manière suivante (B3) . Pour chacune des phrases, on attribue :
si réussite en moins de 30 s 2,4 pts
si réussite entre 30 et 60 s 1,8 pts
si réussite entre 60 et 120 s 1,2 pts
si échec 0 pts.
Le score final représente la moyenne des points sur les huit phrases évaluées.
score B3 |
||
Moyenne |
1,39 |
|
Erreur-type |
0,06 |
|
Médiane |
1.58 |
|
Mode |
1,65 |
|
Écart-type |
0,48 |
|
Plage |
2,02 |
|
Minimum |
0,15 |
|
Maximum |
2,17 |
7. Épreuve B4 : phrase à trou avec
pièges
Dans cette épreuve, une phrase est présentée, avec un mot manquant. Six mots
possibles sont présentés sur l'écran, et il faut choisir celui qui convient.
Voici la phrase d'exemple ; les six mots proposés sont dans l'ordre :
Le bûcheron ...... une maison dans la forêt.
- un seul mot est complètement possible : loue
- un autre est quasiment possible à un détail graphique : Habite
- un autre est possible phonétiquement mais pas graphiquement, c'est un homophone
non homographe : loup
- deux mots appartiennent à un champ sémantique possible globalement mais pas
localement : coupent et arbre
- un autre est un intrus : prêt
Voici les autres phrases, à traiter successivement :
Phrase n°2 :
Veux-tu me prêter ton ...... ?
Cartable
jouer
crayons
jouet
maintenant
jolie
Phrase n°3 :
Il se promène ...... son chien.
sans
laisse
sang
cent
Avec
toujours
Phrase n°4
...... homme, depuis des années, rêvait d'aller au cirque.
Sept
l'
Cette
Les
un
Cet
La réussite à cette épreuve sur des phrases avec des lacunes impose une rapidité dans la prise de décision, sur des mots mis dans un contexte sémantique. Il faut procéder à une élimination graphique (par exemple, Cartable dans la phrase n°2 est impossible avec une majuscule en fin de phrase), une sélection orthographique (sans, sang, cent dans la phrase n°3), une élimination sémantique et/ou grammaticale (fatiguer, or dans le phrase n°1)..
Variable
La réponse donnée peut être rapportée à une de ces 4 catégories :
1. c'est le bon mot (catégorie 1)
2. c'est autre chose, qu'il s'agisse d'un intrus ou d'un mot du champ sémantique
mais impossible (catégorie 2).
3. c'est ce mot à une variante graphique près qui n'en fait pas un autre mot
(catégorie 3)
4. phonétiquement, c'est ce mot mais graphiquement, c'est impossible (catégorie
4) : c'est un homophone non homographe.
Dans toutes les 295 réponses de cette épreuve, il n'y a que 4 réponses qui
soient de catégorie 4. Finalement on calcule un score unique tenant compte du
type de réponse et de la vitesse de réponse. On attribue 1 point pour les bonnes
réponses et 0.2 point pour les réponses de catégorie 3, c'est à dire pour les
confusions de type purement graphique. Les bonnes réponses sont pondérées par
le temps de réponse suivant la règle :
+ 0,4 point quand le temps de réponse est court (c'est à dire inférieur à (moyenne
- la moitié de l'écart-type))
- 0,3 point quand le temps de réponse est long (c'est à dire supérieur à moyenne
+ la moitié de l'écart-type)).
Enfin, on retire 0,5 point si la réponse est de catégorie 2 ou 4 et si le temps de réponse est long (même règle que précédemment).
|
Point(s) pour réussite |
|
Catégorie 1 |
Avec un temps court |
Avec un temps long |
1.4 |
0.7 |
|
Catégorie 2 |
0.2 |
|
Catégorie 3 |
-0.5 |
|
Catégorie 4 |
-0.5 |
- score exercice à trous (B4).
score B4 |
|
Moyenne |
2,92 |
Erreur-type |
0,15 |
Médiane |
3 |
Mode |
2,20 |
Écart-type |
1,19 |
Plage |
6,10 |
Minimum |
0,10 |
Maximum |
6,20 |
8. Épreuve B5 : Tris syntaxiques
Dix mots s'affichent à l'écran. Il faut les répartir en deux catégories grammaticales.
Les mots restent visibles jusqu'à la décision. On enregistre la réponse et le
temps mis.
Quatre listes de dix mots sont à traiter après quelques essais pour chaque liste. Les deux catégories grammaticales changent d'une liste à l'autre.
liste 2 |
liste 3 |
liste 4 |
|
Distinguer les verbes des autres |
distinguer les adverbes des autres mots |
Distinguer les verbes des autres mots |
distinguer les masculins des féminins |
tapions camions créations soulevions partions solutions religions buvions aviations marchions |
lentement retournement absolument vraiment aiment prudemment renomment emprisonnement aisément encadrement |
méfait forfait mangeait parlait portrait lisait lait trait chantait poussait |
belle petite gros bonne bel chaud lourde méchant maladive sportif |
Variables
- le nombre total de mots correctement triés (sur 40)
Bonnes réponses |
|
Moyenne |
32,39 |
Mode |
32 |
Écart-type |
4,37 |
Minimum |
15 |
Maximum |
40 |
Temps moyen |
|
Moyenne |
3,83 secondes |
Écart-type |
1,83 |
Minimum |
0,56 seconde |
Maximum |
10,64 secondes |
C'est la variable que nous garderons comme résumé de cette épreuve. Elle combine temps et réussite. Les deux variables sont additionnées, après avoir été centrées et réduites. Le résultat obtenu est divisé par deux.
efficacité B5 |
|
Moyenne |
0,0 |
Erreur-type |
0,96 |
Médiane |
0,2 |
Mode |
0,3 |
Écart-type |
1,0 |
Minimum |
-3,0 |
Maximum |
1,8 |
L'écart-type très proche de 1 montre que les deux variables sont très peu corrélées.
9. Récapitulation sur les huit épreuves
graphiques
On peut regrouper les caractéristiques de ces huit épreuves dans un tableau
:
Épreuves | Rappel | Contexte | Unités | Indices | Stratégie | Compétence | Disposition lexicale |
A1 | Silhouette possible ou impossible | Absent | Pseudo-mot | Silhouette du mot | Décision lexicale | Graphique | Non |
A2 | "Pendu" sur une phrase | Présent | Phrase + lettre | Consonnes | Utilisation de la structure consonantique de l'écrit | Graphique + syntaxique | Nécessaire |
A3 | Mot caché | Absent | Lettre | Syllabe | Combinatoire | Grapho-phonologique | Non |
B1 | Scrabble | Absent | Lettre | Mot | Combinatoire | Grapho-phonologique | Nécessaire |
B2 | Classer des mots en fonction de leur silhouette | Absent | Mot | Lettre | Résolution de problèmes | Graphique | Non |
B3 | Reconstitution de phrase | Progressif | Mot | Grammaticaux | Combinatoire | Syntaxique | Non |
B4 | Phrase à trous | Présent | Mot et phrase | Grammaticaux | Décision lexicale | Orthographique + sémantique | Non |
B5 | Tri syntaxique | Absent | Mot | Mot | Décision grammaticale | Graphique + lexicale +grammaticale | Non |
Chapitre 6 : Des épreuves aux compétences
techniques
Nous avons déjà mentionné au chapitre III (section 2) tout l'intérêt de relire
les variables issues des épreuves techniques au moyen d'un outil statistique
puissant : l'analyse en composantes principales. C'est ce que nous nous proposons
de faire ici. Rappelons que pour isoler de façon fiable une compétence, il faut
s'abstraire des épreuves, pour retrouver ce qui les unit, à travers les " gestes
" qui y sont déployés ainsi que leurs circonstances. La référence à un contexte
sémantique se trouve par exemple activée dans les épreuves A2 et B4, mais l'épreuve
B4 révèle aussi, avec d'autres épreuves, la capacité à opérer des décisions
lexicales rapides. Les variables issues de A2 et B4 sont moyennement corrélées
entre elles (.31), pourtant elles font références toutes deux à la capacité
de se servir du contexte. Et ce qu'on recherche ici, ce sont bien ces compétences
techniques transversales aux épreuves (comme l'aptitude à se référer au contexte)
pour les mettre ensuite en relation avec la lecture.
L'Analyse en composantes principales va nous permettre de transformer nos 8 variables quantitatives initiales en plusieurs nouvelles variables quantitatives, non corrélées, appelées composantes principales. Nous allons donc examiner successivement ces 8 composantes principales, qui constituerons 8 facteurs techniques indépendants.
1 Première composante principale
Pourcentage de la variance expliquée par l'axe 1 : 32.62 %
Variables |
Corrélation variable / facteur 1 |
A1 |
0.11 |
A2 |
-0.79 |
A3 |
-0.72 |
B1 |
-0.18 |
B2 |
-0.52 |
B3 |
-0.73 |
B4 |
-0.57 |
B5 |
-0.54 |
On observe un effet classique de niveau avec une contribution significative
de 6 variables. Une seule échappe à l'effet, sans pour autant l'équilibrer sur
l'autre pôle : A1, la seule à travailler sur les silhouettes.
Cette première composante représente le niveau général de compétences techniques,
autour de 6 variables : à l'ouest sont groupés les bons résultats.
2 Deuxième composante principale
Pourcentage de la variance expliquée par l'axe 2 : 16.03 %
Variables |
Corrélation variable / facteur 2 |
A1 |
0.56 |
A2 |
-0.09 |
A3 |
0.10 |
B1 |
-0.83 |
B2 |
-0.23 |
B3 |
0.07 |
B4 |
0.05 |
B5 |
0.45 |
C'est l'opposition de A1 et de B1 qui forme cette deuxième composante principale. Qu'est-ce qui est opposé ici ?
Rappelons-nous que le mode de calcul de l'épreuve A1 révèle la capacité à décider qu'un mot prononçable en français ne peut malgré tout pas exister, autrement dit qu'il ne correspond pas à une silhouette graphique possible. On suppose que la réussite passe par l'habitude de traiter les silhouettes communes autant que les mots, donc renvoie à une efficacité de l'empan de lecture, y compris dans la partie parafovéale.
À l'inverse, réussir à B1 nécessite l'habitude de traiter des indices très courts, de la lettre à la syllabe. Le processus de décodage phonologique qui est à l'œuvre dans cette épreuve se déroule par définition sur des unités grapho-phonologiques, de quelques lettres.
L'axe qui se dessine oppose nettement une utilisation de l'écrit qui passe par un codage indirect au traitement de formes graphiques abstraites. Ce facteur va du grapho-phonologique au graphique, de la voie indirecte à la voie directe. La présence de B5 (graphique + décision rapide) du côté de A1 confirme cette interprétation. Cette opposition de la voie indirecte (B1) à la voie directe (A1) repose sur l'habileté à traiter des empans de longueurs diverses, de quelques lettres, à plusieurs mots. Cet axe représente donc la composante de la nature des indices traités.
3 Troisième composante principale
Pourcentage de la variance expliquée par l'axe 3 : 13.40 %
Variables |
Corrélation variable / facteur 3 |
A1 |
0.72 |
A2 |
-0.09 |
A3 |
0.05 |
B1 |
0.15 |
B2 |
0.25 |
B3 |
0.05 |
B4 |
0.38 |
B5 |
-0.56 |
L'axe 3 fait éclater l'aspect graphique qui s'oppose sur l'axe 2 au grapho-phonologique
par la maîtrise de différents indices. Les deux épreuves (A1 et B5), assez semblables
(absence de contexte, décision rapide sur mot, compétence graphique, absence
de disponibilité lexicale) se différencient quant à la nature du traitement
à exécuter pour parvenir à opérer les classements demandés :
- pour A1, on ne peut pas justifier la décision que l'on prend. En effet, on
prend cette décision sur des prégnances de silhouettes de mots, de toute façon,
inconnues. Pourtant, la décision est prise rapidement : on est donc devant une
grande automatisation de la tâche.
- pour B5, on peut prendre le temps de réfléchir pour donner sa réponse. La
décision passe par des catégories, par des schèmes c'est à dire par des représentations
intermédiaires entre les phénomènes perçus et les catégories de l'entendement.
En conséquence, cette troisième composante est celle de l'automatisation des décisions lexicales, dans un traitement d'unité graphique.
L'opposition n'est pas totale du fait de leur contribution commune à l'axe 2 ; on peut (et on devrait ?) être bon dans les deux compétences.
4 Quatrième composante principale
Pourcentage de la variance expliquée par l'axe 4 : 11.76 %
Variables |
Corrélation variable / facteur 4 |
A1 |
-0.18 |
A2 |
-0.29 |
A3 |
0.35 |
B1 |
0.14 |
B2 |
-0.64 |
B3 |
-0.01 |
B4 |
0.52 |
B5 |
-0.05 |
L'axe 4 se construit autour de deux épreuves (B4 et B2) également et inversement indépendantes de A1 (perpendicularité).
B4, a-t-on le droit de l'avouer, est pour nous l'épreuve la plus pertinente dans sa problématique et dans sa réalisation. Pour réussir à B4, il faut franchir le plus vite possible le premier obstacle de la compréhension de la phrase lacunaire, donc éliminer les mots sur des opportunités sémantiques, il faut ensuite procéder à une élimination sur des critères grapho-morphologiques alors que le sémantique conviendrait, il faut enfin décider sur des critères orthographiques puisque les derniers mots candidats sont homophones. C'est une bonne panoplie des compétences (en dehors du traitement des indices flous) dans l'écrit. Cette épreuve montre la capacité de prendre en compte la quasi totalité des indices disponibles (contextuels et visuels) dans une activité ayant un but précis.
Pour réussir à B2, il faut développer une stratégie artificielle (en vision parafovéale, on ne va pas du mot à la silhouette, mais de la silhouette au mot) en ne tenant volontairement pas compte des indices, notamment sémantiques, sur lesquels repose l'usage de l'écrit. On est devant une capacité à prendre des indices en les isolant compètement de tout rapport au signifié.
Cette quatrième composante décrit le mode de traitements des indices graphiques, depuis, on serait presque tenté de dire leur encapsulage jusqu'à leur simultanéité ; c'est la capacité de traitement simultané d'indices.
5 Cinquième composante principale
Pourcentage de la variance expliquée par l'axe 5 : 10.38 %
Variables |
Corrélation variable / facteur 5 |
|
A1 |
0.29 |
|
A2 |
-0.11 |
|
A3 |
-0.15 |
|
B1 |
0.40 |
|
B2 |
-0.31 |
|
B3 |
0.57 |
|
B4 |
-0.33 |
|
B5 |
0.17 |
B3, c'est une résolution de problème qui s'appuie sur une créativité linguistico-sémantique nourrie par un bon traitement d'indices syntaxiques. Comme dans B1 (important aussi pour cette composante), il faut faire tourner (combiner) les éléments, être créatif et rapide dans la combinatoire en référence à du sémantique, mot ou phrase. la langue.
C'est la composante de la créativité linguistique
6 Sixième composante principale
Pourcentage de la variance expliquée par l'axe 6 : 6.54 %
Variables |
Corrélation variable / facteur 6 |
|
A1 |
0.04 |
|
A2 |
-0.33 |
|
A3 |
0.52 |
|
B1 |
0.07 |
|
B2 |
0.18 |
|
B3 |
-0.08 |
|
B4 |
-0.31 |
|
B5 |
0.03 |
L'axe 6 est tiré par A3, la seule épreuve qui suppose un travail sur la lettre
et la syllabe, dans l'absence même du mot, lequel n'existerait qu'encadré par
des blancs. La réussite passe par un tâtonnement grapho-phonologique.
À l'opposé A2 suppose un pilotage (et/ou un contrôle) par le contexte sémantique
(phrase inductrice), ce que semble confirmer d'une part la présence de B4 qui
est aussi une épreuve faisant appel au contexte, et d'autre part la présence
de B3 (avec une faible incidence sur l'axe) présente du même côté avec un pilotage
progressif par le contexte.
C'est la composante de l'horizon d'attente.
7 Septième composante principale
Pourcentage de la variance expliquée par l'axe 7 : 5.30 %
Variables |
Corrélation variable / facteur 7 |
|
A1 |
0.04 |
|
A2 |
-0.30 |
|
A3 |
-0.20 |
|
B1 |
0.18 |
|
B2 |
0.21 |
|
B3 |
-0.12 |
|
B4 |
0.24 |
|
B5 |
0.37 |
C'est un axe qui oppose une conscience grammaticale au niveau des mots hors contexte (B5) à une image de la syntaxe au niveau de la phrase (A2), ce que viennent confirmer l'opposition de A2 à B2 (mots) et le rapprochement de A2 et B3. Même si cette fois, on travaille sur des unités différentes (phrases vs. mots), on est bien, du côté de A2 et B3, dans la capacité de prendre comme unité de réflexion, une unité de grande taille : la phrase. Cette septième composante dessine finalement la conscience de la phrase, la conscience phrastique.
8 Huitième composante principale
Pourcentage de la variance expliquée par l'axe 8 : 3.98 %
Variables |
Corrélation variable / facteur 8 |
|
A1 |
0.20 |
|
A2 |
0.28 |
|
A3 |
0.08 |
|
B1 |
0.20 |
|
B2 |
-0.15 |
|
B3 |
-0.33 |
|
B4 |
-0.06 |
|
B5 |
0.15 |
Bien que de faible contribution, on est sans doute devant une composante assez
précise. La septième composante avait isolé cette conscience de la phrase comme
unité de traitement, cette huitième composante va séparer la façon d'aborder
cette unité phrastique. Dans les deux cas, il s'agit de reconstituer une phrase.
Mais dans A2, la solution va venir de la phrase en s'aidant de l'ajout de lettres
pour trouver des mots ; c'est rapidement un closure. En revanche, dans B3, c'est
le sens d'une phrase qu'il faut construire (dans toutes les acceptions du mot
sens) à partir de mots dont la signification dépend aussi de la place qu'ils
auront dans la phrase. Dans les deux cas on est sur la phrase mais c'est seulement
du côté de B3 qu'elle est à construire. On peut donc faire l'hypothèse que la
réussite à B3, à la différence de la réussite à A2 témoigne de l'habileté, au
sens d'agilité, à créer un sens global nouveau à partir d'éléments ayant isolément
un sens, une sorte de créativité linguistique à tester des hypothèses sémantiques,
une capacité à la pensée divergente tandis qu'A2 est davantage du côté du contexte,
de l'intégration, de la convergence.
C'est sans doute la capacité à émettre des hypothèses sémantiques sur des unités
longues (la phrase) et à les vérifier.
Conclusion
Les composantes principales obtenues répartissent désormais la variance des
résultats de tous les individus à propos de toutes les épreuves autour de 8
axes dont le principe de construction progressive est l'absence totale de corrélation,
ce qui n'était pas le cas pour les variables de départ. Désormais, pour ce qui
concerne cette population de 59 élèves et les 8 composantes principales étudiées,
aucune position d'un individu sur un facteur ne permet de prévoir sa position
sur un autre facteur. De ce fait, toute rupture de cette indépendance qui viendrait
à être observée sera à interpréter comme imputable à la relation de ces facteurs
indépendants à une variable extérieure à expliquer ou aux critères autour desquels
se constitueront et s'opposeront des sous groupes au sein de la population totale.
On poursuivra donc logiquement cette investigation grâce à des analyses de variance
si les variables explicatives sont nominales ou à des régressions multiples
si elles sont continues.
À ce stade, le risque est pris de 8 compétences techniques décrites par la position
de chaque individu sur 8 axes. Les voici à nouveau :
N° Composante (% variance expliquée) |
composante… |
1 (32,62 %) |
du niveau général |
2 (16,03 %) |
de la nature des indices traités. |
3 (13,40 %) |
de l’automatisation des décisions lexicales |
4 (11,76 %) |
de la capacité de traitement simultané d’indices. |
5 (10,38 %) |
de la créativité linguistique |
6 (6,54 %) |
de l’horizon d’attente. |
7 (5,30 %) |
de la conscience phrastique. |
8 (3,98 %) |
des hypothèses sémantiques sur des unités longues |
1. Recherche documentaire
Il s'agit d'une épreuve chronométrée de consultation documentaire pour répondre
à des questions, le document étant en permanence disponible. On est devant deux
pages bien structurées avec des modes de présentation diversifiés, textes, graphiques,
photos, cartes…
Les documents sont présentés en annexe 1. Il y a douze questions, l'épreuve n'utilise pas l'ordinateur.
Il s'agit d'entourer la bonne réponse pour chacune des 12 questions qui font appel à des techniques d'information différentes. L'épreuve est chronométrée.
On pense évidemment à enregistrer le temps mis pour répondre à l'ensemble des
questions et le nombre de bonnes réponses
- Le temps pour répondre (T)
Moyenne |
606 secondes |
Écart-type |
288 |
Moyenne |
9.75 |
Écart-type |
1.89 |
Moyenne |
65.3 secondes |
Écart-type |
34.1 |
Moyenne |
71,89 |
Erreur-type |
4,817 |
Médiane |
67,5 |
Mode |
116,47 |
Écart-type |
36,97 |
Plage |
144,33 |
Minimum |
21,82 |
Maximum |
166,15 |
C'est cette variable que nous conserverons pour décrire la performance à ce type assez fréquent de lecture pour consulter des documents qui ne sont pas exclusivement du texte, même si l'écrit y est toujours nécessaire, et qui fait appel en permanence à de la compréhension et du traitement d'information, depuis le texte même des questions jusqu'à la structure des pages. Le résultat tient compte à la fois de la qualité et de la promptitude de la réponse.
2. Lecture de textes courts
On précise à l'élève qu'on cherche à mesurer quelle est sa vitesse efficace
de lecture, c'est-à-dire celle qui le fait aller vite en lui assurant une issue
favorable, ici la bonne réponse à une question qui lui est posée après la lecture
du texte. Les textes sont standards pour la classe d'âge et sont diversifiés
(presse, documentaire, fiction). L'épreuve se déroule sur l'ordinateur. Il y
a neuf textes possibles.
Les documents (textes et questions) sont présentés en annexe 2.
Chaque texte s'affiche, l'élève indique quand il a terminé la lecture et doit répondre alors à une question. L'épreuve s'arrête lorsque 3 réponses correctes sont données à la suite. En fait, ces 3 réponses exactes et consécutives ont été obtenues pour tous les élèves au plus tard au 7ème texte.
variables
Trois informations vont être prises ou construites : vitesse moyenne textes courts
On calcule ici la vitesse moyenne sur les différents textes en ayant éliminé la vitesse maximum et minimum, quelle que soit la réponse donnée.
Moyenne 14940 mots/heure Écart-type 9905 Min. 3406 Max 51844 Presque 15000 mots/heure de moyenne pour cette population, c'est une bonne performance, qui correspond à des empans moyens de 8 à 9 signes lors de chaque fixation.
La vitesse la plus faible n'est pas loin d'une exploration syllabique (moins d'un mot à la seconde) et la vitesse la plus grande correspond, en lecture intégrale, à des empans proches de 5 mots. Notons que cet élève satisfait néanmoins à la condition des 3 réponses correctes consécutives dès le 5ème texte, ce qui le situe un peu au-dessus de la moyenne. le nombre de textes courts nécessaires On enregistre le numéro du texte auquel l'élève s'est arrêté. Le score 3 signifie qu'on a satisfait à la condition (3 bonnes réponses de suite) dès le troisième texte. Moyenne 5.15 Écart-type 1.05 Min. 3 Max 7 On peut considérer que l'élève procède à la recherche de sa bonne vitesse de lecture, celle qui va lui permettre de donner la réponse à une question qu'il ne connaît pas encore au moment de la lecture, donc qui l'oblige à une vigilance large. Pour ceux dont le score est 3, il est impossible de savoir s'ils sont à leur bonne vitesse ou s'ils fonctionnent en dessous de leurs capacités réelles. C'est pourquoi nous avons construit une nouvelle variable afin de mieux définir une efficacité de lecture à partir de la vitesse moyenne et du nombre de textes nécessaires.. vitesse efficace textes courts On calcule une vitesse pondérée par le nombre de textes qu'il a été nécessaire de lire pour établir cette vitesse efficace.
Nous utilisons une formule (vitesse divisée par la racine carrée du (nombre de textes moins 2)) qui conserve sa vitesse à celui à qui seulement 3 textes ont été nécessaires. Ainsi celui qui a lu le plus lentement (3406 mots/heure) mais à qui seulement 3 textes ont suffi conserve cette vitesse tandis que le plus rapide (51844 mots/heure) mais à qui il a fallu 5 textes voit sa vitesse efficace descendre à 29332 mots/heure. C'est cette information que nous conservons pour décrire la performance sur cette épreuve, qui correspond à une forme de lecture très courante, sans doute à l'œuvre dans plus de 60 % des situations ordinaires, celles où il s'agit de travailler simplement sur l'explicite du texte, ce qui correspond à ce que la Direction des Etudes et Prospective du Ministère de l'Eductaion Nationale décrit comme une " compétence approfondie ". Vitesse efficace textes courts Moyenne 8589,08 m/h Erreur-type 763,39 Médiane 6261 Écart-type 5863,76 Minimum 1949 Maximum 29932 3 Lecture d'un texte long C'est une épreuve qui aborde la lecture savante, le travail sur l'implicite du texte, ce que la DEP donne comme " compétence remarquable " et dont semble ne disposer que 20 % des élèves qui entrent en sixième.
Il s'agit de dépasser ce que dit le texte pour atteindre ce qu'il veut dire, l'intention de l'auteur qui avance masqué derrière les moyens qu'il emploie au niveau de l'organisation d'ensemble d'un texte Le texte, long de 1526 mots, est présenté à l'écran d'ordinateur ; l'élève peut parcourir à sa guise les 9 pages écran pendant le temps qu'il estime nécessaire. Ensuite, il répond à des questions sur une fiche papier, mais le texte n'est plus consultable. L'auteur de ce texte est Gianni Rodari. Cette épreuve sera dorénavant nommée RODARI.
Les documents sont présentés en annexe 3.
Variables Vitesse de lecture en mots/heure
Moyenne 11835 m/h Écart-type 7328 Min. 3537 Max 45030
La vitesse est ici inférieure à celle des textes courts, ce qui témoigne en faveur de l'adaptation des stratégies à la tâche. Toutefois, les enfants ayant des vitesses lentes restent lents quoiqu'il arrive par impossibilité technique de faire autrement. Ce point n'est pas pour nous un sujet d'investigation mais on rencontre tant d'a priori sur la vitesse en lecture qu'il est utile de donner, en passant, ces résultats opposant les 8 plus lents et les 8 plus rapides lecteurs des textes courts : Vitesse textes courts Vitesse Rodari Compréhension Rodari
Les 8 plus lents aux textes courts 4308 mots/heure 4178 mots/heure 55.5
Les 8 plus rapides aux textes courts 34835 mots/heure 22097 mots/heure 53.5
On observe que devant un texte plus difficile, le lecteur rapide réduit sa vitesse d'un tiers, tandis que le lecteur lent lit toujours à la même vitesse. Et si on en juge à la performance en compréhension (variable sur laquelle nous anticipons puisque nous la présenterons ensuite), il n'y a pas à chercher d'explication du côté d'un quelconque 'niveau général'. On est devant une insuffisance technique : les lents lisent 2 fois moins vite que l'expression orale, les rapides 2 fois plus vite, soit une variation du temps de 1 à 4, pour le même résultat en compréhension. Aussi ne faut-il pas s'étonner que les lents se détournent de l'écrit dès qu'ils n'y sont pas contraints. Compréhension Rodari Elle est calculée à partir de la grille des réponses, remplie par l'élève. Un barème a été établi par des 'juges' qui ont considéré qu'une compréhension n'est jamais du tout ou rien mais qu'il y a des degrés d'interprétation qu'ils ont tenté d'évaluer. Il devrait être possible de perfectionner cette approche en cherchant à cerner l'existence ou non d'une cohérence entre toutes les questions à propos de scénarios interprétatifs. L'épreuve comptait dix-sept questions, mais une a été écartée du résultat final. Toutes les questions sont présentées en annexe 3. Le score est la somme des questions 1 à 11 à laquelle s'ajoutent les 2/3 de la somme des 5 questions classées à la question 13. La question 12 n'a finalement pas été retenue. Le maximum possible est 94.
Compréhension Rodari Moyenne 54,2 points Écart-type 10,1 Maximum 75 Minimum 31
Nous considérons que cette manière de décrire la compréhension correspond assez fidèlement aux définitions qu'on peut donner des effets d'une lecture experte, observée sur un texte littéraire se rapprochant de ce qu'il est convenu d'attendre ensuite dans les classes de premier cycle. Efficacité Rodari L'efficacité sur cette épreuve est calculée d'après cette formule qui vise à établir une parité entre la contribution de la vitesse et de la compréhension. Efficacité rodari Moyenne 24,00 Erreur-type 1,06 Médiane 22,38 Mode 21,98 Écart-type 8,11 Plage 36,03 Minimum 11,95 Maximum 47,98 C'est cette mesure de l'efficacité que nous conserverons pour caractériser cette forme de lecture savante qui porte sur l'écriture littéraire. Si nous ne devions conserver qu'une seule mesure de la performance en lecture (mais ce n'est pas l'option que nous avons retenue), c'est incontestablement ce résultat qui nous servirait de point de repère car il nous semble que c'est dans la confrontation à l'écriture dans ce qu'elle a de plus élaborée, c'est-à-dire face au texte littéraire, que la qualité de la lecture se révèle le plus complètement 3 Lecture de recherche C'est un type d'épreuves qui a déjà été utilisé avec les mêmes enfants lorsqu'ils étaient au CE1 (février). On demande à l'enfant, en CM2, de retrouver le plus vite possible un extrait dactylographié, parmi des ouvrages disposés devant lui. Cette situation conduit le lecteur à mettre en œuvre successivement des stratégies diversifiées, qui font également appel à sa connaissance des productions écrites et de leurs particularités : compréhension de l'extrait afin d'en tirer des pistes de recherche (de quoi il parle, pour quel public, avec quel style, dans quel cadre, dans quelle intention, etc.) ; élimination des ouvrages qui ne correspondent pas ; consultation des ouvrages sélectionnés (recours aux tables des matières, index, etc.) ; localisation (appui sur la mise en page, les hiérarchies, lecture sélective, recherche rapide, etc). On a là une panoplie assez large et bien finalisée de gestes de lecture. L'épreuve demande de localiser deux extraits (un documentaire, un de fiction) dans le même lot de livres.
Premier extrait : " Tout autre est le fonctionnement de l'alphabet qui permet, en principe, avec une trentaine de signes, de tout écrire. Ce n'est évidemment pas tout à fait aussi simple et les vingt-six lettres de notre alphabet, par exemple, ne traduisent pas tous les sons… d'où de cruciaux problèmes d'apprentissage de l'orthographe pour les écoliers. "
Deuxième extrait : " Cette idée-là lui vint au lit alors qu'elle repassait dans sa tête le film qu'elle avait vu à la télévision, l'après-midi même. C'était un film d'espionnage si compliqué que la plupart du temps elle aurait été bien en peine d'expliquer ce qui se passait, - surtout qu'elle avait pris l'histoire en marche, alors qu'il y avait déjà un cadavre au pied de l'escalier dont elle n'avait vu que la fin de la chute. "
La liste des dix-sept ouvrages proposés : Jaffabules, Pierre Coran La boîte aux lettres secrètes, Jan Mark Journal d'Anne Franck Prête-moi ta plume, Jacques Charpentreau Carnets de bord, les enfants de la baleine blanche Les trois plumes et douzes autres contes, Grimm Lettres de mon moulin, Daudet Les voleurs d'écriture, Azouz Begag À vos plumes citoyens, Gérard Gengembre L'écriture mémoire des hommes Hiéroglyphes, l'écriture de l'égypte ancienne La lettre brûlée, Rolande Causse Point d'interrogation, le hamster qui aimait les livres Les lettres et la typographie L'écriture et le livre Écritures, signes et codes secrets Un livre des hommes
L'observateur a pour mission de décrire au plus près des gestes en utilisant les grilles de comportements présentées en annexe 4.
Variables Pertinence des stratégies
Le dépouillement de ces grilles va permettre d'évaluer la pertinence des stratégies lors de l'élimination/sélection des ouvrages puis lors des tentatives de localisation à l'intérieur des ouvrages retenus.
Moyenne 22.02 Écart-type 9.03 Min. 1 Max 39 Réussite
Il s'agit, au-delà des stratégies, de décrire leur efficacité à travers la localisation effective des extraits et la prise en compte du temps pour y parvenir.
Réussite lecture de recherche Moyenne 3,32 Erreur-type 0,60 Médiane 0,00 Mode 0,00 Écart-type 4,62 Minimum 0,00 Maximum 17,00
On voit que cette épreuve est très sélective puisque 36 élèves y échouent, ce qui donne plus de prix à la réussite des autres. Malgré une distribution peu orthodoxe, nous gardons ce résultat car il témoigne, certes de manière brutale, de performances différentes à une forme de lecture de recherche fréquente et qui suppose, à côté de techniques spécifiques, que le lecteur ait une familiarité avec les caractéristiques et l'organisation de la production écrite.
3 Construction d'un indice composite de performance de lecture
Les quatre épreuves différentes utilisées pour décrire la performance de lecture s'articulent autour de 4 situations de lecture ; elles nous ont semblé révélatrices de ce qui attend un lecteur adolescent : utiliser un texte documentaire (manuel) pour en tirer des informations ponctuelles parcourir des textes relativement simples (journal) pour en extraire de l'explicite conduire une lecture savante sur un texte (littérature) procéder à la consultation de nombreux ouvrages (BCD ou CDI) pour localiser une information. Nous n'avons pas fait le choix de les additionner comme si elles étaient équivalentes et indépendantes les unes des autres. Nous avons, au contraire, choisi de construire un indice de niveau général de performances à partir des axes d'une analyse en composantes principales. Analyse en composantes principales TABLEAU DES 2 PREMIERES VALEURS PROPRES Numéro Valeur propre Pourcentage Pourcentage cumulé 1 1.7394 43.39 43.39 2 1.2458 31.15 74.63 Part de chaque variable active dans la construction de l'axe
1. Variable Corrélation variable-facteur
1 Recherche documentaire RHNY 33 % Vitesse corrigée textes courts VCTC 78 % Efficacité rodari EfRo 92 % Réussite lecture de recherches REGR 40 %
On voit que le premier axe est clairement celui du niveau auquel concourent les 4 épreuves. L'axe 2 différencie la performance selon qu'elle porte sur une consultation de documents ou sur un survol assez superficiel de textes faciles. C'est donc la coordonnée des individus sue l'axe 1 qui déterminera leur performance composite en lecture, performance dans laquelle aura été retirée la répétition, d'une épreuve à l'autre, du niveau de cette performance. Il est donc maintenant possible de procéder à la dernière étape de ce travail en mettant en relation une performance de lecture qui nous semble solidement construite et des compétences techniques construites sur des situations de traitement de l'écrit hors de la lecture.
Chapitre 8 : Rapports entre compétences techniques et performances de lecture. Nous disposons de 8 compétences techniques et d'une performance de lecture mesurée indépendamment d'eux. Comment explorer les liens entre ces variables ?
1. Le modèle d'analyse. Cette exploration sera conduite à travers l'étude des régressions linéaires multiples : La variable à expliquer (variable endogène) est la performance de lecture. Les variables explicatives indépendantes (variables exogènes) sont les 8 compétences techniques construites précédemment par l'analyse en composantes principales. AJUSTEMENT DES MOINDRES CARRES (AVEC TERME CONSTANT) 59 INDIVIDUS, 9 VARIABLES (CONSTANTE EN QUEUE). IDEN LIBELLE Coefficient Ecart-type Student (50) Probabilité. Composante 1 - niveau général -0.0885 0.092 0.967 0.338 Composante 2 - Nature Indices Traités 0.2753 0.131 2.109 0.040 Composante 3- automatisation décision Lexicale 0.0294 0.143 0.206 0.838 Composante 4 - Traitement simultané indices 0.4596 0.152 3.016 0.004 Composante 5- Créativité linguistique 0.3716 0.162 2.291 0.026 Composante 6 - Utilisation de l'horizon d'attente -0.2546 0.204 1.246 0.219 Composante 7 - Conscience phrase -0.0462 0.227 0.203 0.840 Composante 8 - Hypothèses sémantiques -0.6479 0.262 2.472 0.017 CONSTANTE 0.0000 0.148 0.000 1.000 Somme des carrés des écarts ........... SCE = 64.4767 Coefficient de corrélation multiple... R = .5955 R2 = .3546 Variance estimée des résidus S2 = 1.2895 S = 1.1356 Test de nullité simultanée des coefficients des 8 variables : FISHER = 3.434 DEG.LIB = 8 50 P.CRIT = .0032 V.TEST = 2.73 La probabilité du test de nullité simultanée des coefficients des 8 variables est de 3 %. En conséquence, nous rejetons l'hypothèse nulle (P inferieur à 5%), qui si elle avait été acceptée n'aurait pas permis de valider le modèle. Il y a donc des relations entre les variables explicatives et la variable endogène. Les variables explicatives, combinées ensemble expliquent environ 35 % du modèle (R2 = 0.35).
Il est bien évident que les compétences techniques qui interviennent en lecture ne se réduisent pas aux 8 que nous avons définies à partir des exercices que nous proposions. Il n'empêche qu'elles ont déjà un pouvoir explicatif non négligeable. Il manque ici très probablement pour mieux saturer le modèle l'intervention de compétences plus générales que celles auxquelles faisaient appel nos exercices : attentes par rapport à un texte, buts de la lecture, connaissance du monde en général, connaissance du sujet abordé par le texte… La lecture, considéré comme une activité complexe ne peut se résumer à l'étude des compétences techniques que nous avons relevées ; de ce fait, on peut s'estimer satisfait d'arriver à expliquer tout de même 35 % du phénomène par nos variables exogènes.
2. Les composantes techniques en rapport avec la performance de lecture.
L'analyse précédente fait apparaître que quatre composantes sur les 8 contribuent de manière significative (P 0.05) à l'explication de la performance de lecture. L'intérêt de ce type d'analyse, c'est qu'on enlève les effets des corrélations entre variables et qu'on peut observer l'effet d'une variable lorsqu'il n'y a qu'elle qui varie, toutes les autres étant maintenues constantes par construction.
2.1. Première contribution technique
La composante technique qui possède la contribution la plus significative à la variation de la performance de lecture est celle qui décrit la capacité de traitement simultané des indices graphiques. Coefficient Ecart-type Student (50) Probabilité. Composante 4 - Traitement simultané indices 0.4596 0.152 3.016 0.004 Le coefficient de cette composante est positif : plus on se trouve du côté positif de cette composante (de l'axe), meilleurs sont les résultats en lecture. On est donc devant l'observation suivante : toutes les autres composantes étant maintenues égales par ailleurs, toute augmentation de la diversité des indices traités simultanément produit une élévation de la performance de lecture. A l'inverse, les mauvaises performances en lecture sont associé à un petit nombre d'indice traités simultanément.
2.2 Deuxième contribution technique
La seconde composante technique qui contribue à la performance de lecture est celle qui permet d'émettre des hypothèses sémantiques sur des unités longues (phrase) et de les vérifier. Coefficient Ecart-type Student (50) Probabilité. Composante 8 - Hypothèses sémantiques -0.6479 0.262 2.472 0.017 Le coefficient de cette variable est négatif, montrant ainsi que plus on se trouve du côté négatif de la composante (axe 8), meilleurs sont les résultats à l'indice de performance de lecture. En conséquence, plus on est capable de faire fonctionner le jeu complexe d'émission et de vérification d'hypothèses sur des unités longues, meilleur on est en lecture. Le bon lecteur témoigne de l'habileté, presque au sens d'agilité, à créer des hypothèses de sens et à les faire fonctionner sur les éléments graphiques alors que le mauvais lecteur est plutôt du côté de la fusion, de la construction à partir des éléments.
2.3 Troisième contribution
La troisième composante technique qui contribue à la performance de lecture est celle qui témoigne d'une sorte de créativité linguistique. IDEN LIBELLE Coefficient Ecart-type Student (50) Probabilité. Composante 5- Créativité linguistique 0.3716 0.162 2.291 0.026 Le coefficient de cette composante est positif : plus on se trouve placé du côté positif de cette composante (de l'axe), meilleurs sont les résultats en lecture. En conséquence, être bon en lecture, c'est résoudre des problèmes de recherche de sens en prenant appui sur une créativité linguistique guidée notamment par des indices syntaxiques.
2.4 Quatrième composante
La quatrième composante technique qui contribue à la performance de lecture porte sur la nature des indices pris en compte. IDEN LIBELLE Coefficient Ecart-type Student (50) Probabilité. Composante 2 - Nature Indices Traités 0.2753 0.131 2.109 0.040 Le coefficient de cette composante est positif. La compétence que porte cet axe est construite sur l'opposition entre le recours à des unités courtes, la lettre et la syllabe, entrant dans le décodage phonologique et le recours à des formes graphiques abstraites matérialisées pour nous par des silhouettes. Le bon lecteur serait celui qui est capable de traiter d'autres indices que ceux que la vision fovéale permet de voir nets.
3. Conclusions
Seules ces quatre composantes, dans les limites de notre modèle, jouent un rôle dans la performances de lecture telle que nous l'avons calculée. Cela ne veut pas dire qu'un bon lecteur n'est pas bon sur d'autres composantes techniques entrant dans la résolution des exercices techniques que nous avons proposés. Cela veut dire qu'on n'observe pas, toutes choses étant égales par ailleurs, d'effets de ces autres compétences techniques sur la lecture et qu'on peut alors faire l'hypothèse qu'elles ne sont pas des compétences qui contribuent à la lecture, même si elles sont des compétences techniques sur l'écrit. Il faut donc en revenir à ces 4 compétences. Ce qui saute aux yeux, c'est qu'elles vont ensemble 2 par 2, même si par construction elles sont totalement indépendantes. Un premier groupement de deux axes (effets 2 et 4) définit un plan où se joue la question de la nature des indices dans l'écrit. Ce plan est celui du texte, du visible, du graphique, des informations qui vont y être prises.
Il se structure : d'une part autour de la prise en compte de la diversité des indices disponibles. Ceci vient confirmer notre première hypothèse qui supposait une discrimination entre bons et mauvais lecteurs dans la multiplicité des informations prises simultanément. Ce résultat conforte un peu plus les théories interactionnistes, dans la mesure où on n'est pas dans un schéma impliquant une suite agrégative d'informations avec une sélection après chaque indice, mais dans un choix, une sélection en fonction d'une grande quantité d'indices simultanés. d'autre part de la capacité à les traiter en dehors d'une vision nette. Ceci vient confirmer notre deuxième hypothèse, qui spéculait sur l'aptitude des bons lecteurs à maîtriser les catégories de formes graphiques dégradées. Il semble maintenant acquis que les bons lecteurs manient de manière plus experte la reconnaissance de ces catégories visuelles, en l'absence de toutes référence sémantique, sur des critères logographiques.
En ce sens, ce résultat consolide l'hypothèse émise par Inhoff (INHOFF, 1989). Le deuxième groupement de deux axes (effets 5 et 8) définit un plan où se rencontrent la capacité d'émettre des hypothèses sémantiques sur des unités longues (phrase) et celle de rechercher du sens en prenant appui sur une créativité linguistique guidée là encore par des indices syntaxiques. A l'inverse du plan précédent qui situe les compétences techniques autour du point de fixation, ce deuxième plan est à l'extérieur du texte, dans la capacité de le questionner en liaison avec une expérience linguistique. Ce serait en quelque sorte le plan dans lequel le lecteur fait tourner des hypothèses jusqu'à ce qu'elles organisent convenablement (par rapport à son attente) les données du plan précédent. Nous n'avions pas fait d'hypothèses à ce sujet. Ces deux plans pourraient ainsi recouvrir les deux pôles de l'interaction mais dans une définition différente : Les éléments de bas niveau dans leur simultanéité et dans l'obligation de leur prêter de l'information sémantique pour compenser la dégradation de l'information visuelle ; Les éléments de haut niveau qui participent de l'instance " proactive " sans laquelle il n'y a pas de traitement d'unités larges dans le texte mais qui se redéfinit elle-même sur des indices au niveau de la phrase. S'agit-il toujours dans ce cas d'une interaction ? Perspectives L'ensemble des résultats de cette recherche contribuent au questionnement d'une position simplement interactionniste de la lecture. Les deux hypothèses que j'avais posées portaient sur la différenciation des stratégies entre bons et mauvais lecteurs. Le premier plan formé par les quatrième et deuxième composantes semble les confirmer. En revanche, le deuxième plan devrait permettre de formuler de nouvelles hypothèses. La représentation suivante peut aider à visualiser ce qui semble plus assuré après ce travail qu'avant : D'une part, le fait de se servir du contexte semble bien discriminer les bons des faibles lecteurs. Il semble de plus en plus certain que le lecteur fait " feu de tout bois " dans toutes les situations de lecture. Toutes les informations dont il dispose sont activées simultanément pour résoudre la tâche mais aussi sélectivement par rapport au questionnement. D'autre part, la qualité de la lecture est dépendante de la nature des informations qu'ils prélèvent dans l'écrit : du côté des faibles lecteurs, les unités courtes sont traitées avec un maximum de pertinence mais elles portent peu d'informations ; du côté des bons lecteurs, on est capable de tirer de l'information d'unités beaucoup plus larges. Il semble que cela se manifeste par la capacité à concevoir et à traiter des unités de type logographique prenant appui sur les silhouettes de lettres et de mots. Ces conclusions, si on les rapporte aux débats qui traversent la littérature scientifique, s'inscrivent donc dans l'optique du dépassement du modèle autonomiste qui suppose une succession des processus mais aussi conduisent à requestionner les notions de contexte et d'interaction. L'interaction sert aujourd'hui encore pour expliquer la façon dont on accède au lexique. Si on considère, avec elle, que le contexte joue un rôle dans cet accès, cela veut dire que ce qui entre en jeu, c'est le contexte sémantique (préactivation d'un sème par un contexte sémantique), et/ou le contexte linguistique (effet de priming, ou encore effet de fréquence de mot). On est donc toujours dans un contexte de haut niveau, au sens de la connaissance du monde (construit par nos savoirs sur le monde ET par la phrase en cours de lecture ; savoirs linguistiques généraux). Nous ne pouvons bien sûr qu'approuver cette façon de penser. Cependant, on peut sans doute introduire une notion peu développée de contexte graphique local. En effet, nous avons vu que, lorsque les yeux s'arrêtent à un point de fixation, les meilleurs lecteurs sont capable de traiter de l'information dégradée, mais par ailleurs sont aussi capables de traiter simultanément un grand nombre d'indices. Il ne s'agit plus alors, pour les meilleurs lecteurs, de prendre une information qui conforterait ou infirmerait leurs hypothèses sémiques en cours, mais d'être capables de mettre en relation l' (ou les) hypothèse(s) en cours de validation et des informations plurielles extraites simultanément d'un contexte visuel local. En quelques sortes, la véritable interaction ne pourrait se réaliser qu'en s'extrayant de son aspect binaire (contexte et information) et en intégrant véritablement plusieurs types d'informations, issues de différents contextes, généraux et locaux. Cette interaction redéfinie ne peut avoir lieu que si le lecteur opère à partir et avec des informations dégradées. S'il se cantonne au traitement des trois ou quatre lettres nettes, il s'oblige à ne traiter qu'un seul type d'information, celui issu du décodage grapho-phonologique. On pourrait donc dire que la vision floue, la vision parafovéale, est le véritable lieu de l'interaction. Si on accepte cette hypothèse, il faut envisager d'étudier plus finement les mécanismes cérébraux à l'œuvre dans cette interaction. C'est là un objet d'étude pour la psychologie cognitive, si tant est qu'elle réexamine le postulat d'un mot par point de fixation de l'œil, postulat qui me semble appelé à évoluer rapidement. Enfin, si les compétences techniques de lecture sont ce qu'elles semblent être ici, la question pédagogique se pose évidemment de savoir comment aider leur développement. Il n'est pas possible dans le cadre de ce diplôme d'aborder cette question même si elle peut éclairer le problème central. Toutefois, il est aujourd'hui assuré à travers l'ensemble des résultats de la cohorte sur laquelle j'ai travaillé que les options pédagogiques dans le cycle 2 ont des effets significatifs sur la performance de lecture des élèves à la fin du CM2 et notamment à travers la variation de leurs compétences techniques et, plus précisément, du moment d'apparition de ces compétences. Il semble donc qu'une approche simultanée des relations entre compétences techniques et performances de lecture, d'une part, et des conditions pédagogiques qui rendent possibles leur développement, d'autre part, puisse constituer une piste de recherche féconde.
Bibliographie
Adams M. Models of word recognition. Cognitive Psychology, 11 : 133-179, 1979. Adams MJ. Starr BJ. Les modèles de lecture. Bulletin de psychologie, 356 : 696-704, 1982. Alegria J. Mécanismes spécifiques de la lecture : l'identification des mots écrits. In : Les Entretiens Nathan, Actes I, Nathan, 51-67, 1991 Berchadsky J. Interaction. Les actes de lecture, 42 : 60-67, 1993. Berthoz A, Petit L. Les mouvements du regard : une affaire de saccades. La recherche, 289 : 58-65, 1996. Berthoz A. Le sens du mouvement, Paris, Odile Jacob, 1997. Carpenter PA, Just MA. What your eyes do while your mind is reading. (pp 275-307), In : Rayner K. Ed, Eye movements in reading : perceptual and language processes, New-York, 1983. Damasio AR . L'erreur de Descartes, Paris, Odile Jacob, 1995. Denhiere G, Baudet S. Lecture, compréhension de texte et sciences cognitives, Paris, PUF, 1992. Dopkins S, Morris RK, Rayner K. Lexical ambiguity and eye fixations in reading : a test of competing models of lexical ambiguity resolution. Journal of memory and language, 31 : 461-476, 1992. Dubois D, Aubret J. Stratégies syntaxiques et compréhension de la langue écrite, Langue Française, 80 : 51-61, 1988. Everatt J, Underwood G. Individual differences in reading subprocesses : relationships between reading ability, lexical access, and eye movement control. Language and speech, 37 : 283-297, 1994. Fayol M. La compréhension lors de la lecture : un bilan provisoire et quelques questions. In : P.Lecocq (Ed.) La lecture. Processus, apprentissage, troubles. Presses universitaires de Lille, 1992. Fayol M, Gombert JE, Lecocq P, Sprenger-Charolles L, Zagar D. Psychologie cognitive de la lecture, Paris, PUF, 1992. Fodor J. La modularité de l'esprit. Ed Minuit 1986 (Modularity of mind, Cambridge MIT Press, 1983) Foucambert D, Foucambert J. Empans et silhouettes, Les actes de lecture, 49 : 84-110, 1995. Foucambert D. La conception d'un logiciel d'analyse de textes. Memoire de DHEPS, Sorbonne nouvelle, Paris 3, 1994 Foucambert J. La manière d'être lecteur. Paris, OCDL, 1976. Foucambert J, Chenouf Y, Violet M. La lecture dans le cycle des 5-8 ans. Rapport de recherche INRP, 1994. Frith U. A developmental framework for developmental dyslexia, Annals of Dyslexia, 69-81, 1986. Goigoux R. L'apprentissage initial de la lecture. De la didactique à la psychologie cognitive (étude longitudinale). Thèse d'état, Université Paris V, 1993. Gombert JE. Les activités cognitives en œuvre dans la lecture et son acquisition, In : Andrieux F, Besse JM, Falaize B. Illétrisme : Quels chemins vers l'écrit (pp 129-144), Magnard, 1996. Goodman KS. Reading : a psycholinguistic guessing game. Journal of the Reading Specialist, 6 : 126-135, 1967. Goody J. La raison graphique : la domestication de la pensée sauvage. (trad 1979), Paris, Minuit, 1979. Hyönä J. Do irregular letter combinations attract readers' attention ? Evidence from fixation location in words. Journal of experimental psychology : human perception and performance, 21 : 68-81, 1995. Hyönä J, Olson RK Eye fixation patterns among dyslexic and normal readers : effects of word length and word frequency. Journal of experimental psychology : learning, memory and cognition, 21 : 1430-1440, 1995. Inhoff AW. Parafoveal word perception : a further case against semantice preprocessing. Journal of Experimental Psychology : Human Perception and Performance, 8 : 137-145, 1982. Inhoff AW. Lexical access during eye fixations in reading : are word access codes used to integrate lexical information accross interword fixations ? Journal of memory and language, 28 : 444-461, 1989. Inhoff AW, Rayner K. Parafoveal word processing during eye fixations in reading : effects of word frequency. Perception and psychophysics, 40 : 431-439, 1986. Inhoff AW, Topolski R, Vitu F, O'Regan JK. Attention demands during reading and the occurrence of brief (express) fixations. Perception and psychophysics, 54 : 814-823, 1993. Johnson-Laird PN. Mental Models : towards a cognitive science of langage, inference, and consciousness, Cambridge, Cambridge University Press, 1983. Legge GE. An ideal observer model of reading, ARVO, 1992. Legge GE, Klitz & Tjan . Mr. Chips: An Ideal-Observer Model of Reading. Psychological Review, 104 : 524-553, 1997. McClelland JL, Rumelhart DE. An interactive activation model of context effects in letter perception : I. An account of basic findings, psychological review p.88, 375-407, 1981. Morton J. Interaction of information in word recognition, Psychological Review, 76 : 165-178, 1969. O'Regan JK. Facteurs sensoriels et moteurs dans la lecture : la position optimal du regard. In : P.Lecocq (Ed.) La lecture. Processus, apprentissage, troubles. Presses universitaires de Lille, 1992. Paire-Ficout L. La phonologie est-elle un obstacle pour un sourd ?, In : Andrieux F, Besse JM, Falaize B. Illétrisme : Quels chemins vers l'écrit (pp 164-171), Magnard, 1996. Perfetti CA, Lescold AM. Coding and comprehsnion in skilled reading and implication for instruction, In : LB Resnick and P Weaver (Eds), Theory and practice of early reading (Vol 1), Hillsdale NJ, Lawrence Erlbaum Ass. 1979. Philippeau G. Comment interpréter les résultats d'une analyse en composantes principales ?, ITCF, 1986 Posner MI, Abdullaev YG. Dévoiler la dynamique de la lecture. La recherche, 289 : 66-69, 1996. Rayner K, Pollatsek A. The psychology of Reading. Unglued Cliffs, NJ : Prentice-Hall, 1989. Rémond M. Pourquoi certains enfants ne comprennent-ils pas ce qu'ils lisent ? In : CRESAS N°10. L'enfant apprenti lecteur : l'entrée dans le système écrit (pp133-150), INRP L'Harmattan, 1993. Rosenfield I. La conscience, une biologie du moi. Eshel, 1991. Schuberth RE, Eimas PD, Effects of context on the classification of words and nonwords, Journal of Experimental Psychology : Human Perception and Performance, 3 : 27-36, 1977. Sereno SC, Rayner K. Fast priming during eye fixation in reading, Journal of experimental psychology : Human Perception and Performance, 18 : 173-184, 1992. Sinatra GM. Convergence of listening and reading processing, Reading Research Quarterly, 25 : 116-130, 1990. Sprenger-Charolles L. L'évolution des mécanismes d'identification des mots. In : Fayol M, Gombert JE, Lecocq P, Sprenger-Charolles L, Zagar D. (Eds.), Psychologie cognitive de la lecture. PUF, Paris, 1992. Stanovich KE. Attentional and automatic context effects in reading, In : Lesgold AM, PerfettiCA (Eds), Interactive Process in Reading, Hillsdale, Erlbaum, 241-267, 1981. Taft M, Forster KI. Lexical storage and retrieval of polymorphemic and polysyllabic words. Journal of Verbal Learning and Verbal Behavior, 15 : 607-620, 1976. Trueswell JC, Tanenhaus MK, Garnsey SM. Semantic influences on parsing : use of thematic role information in syntactic ambiguity resolution. Journal of memory and language, 33 : 285-318, 1994. Verspieren MR. Recherche-action de type stratégique et science(s) de l'éducation. Contradiction/L'Harmatan, 1990. Vitu F, O'Regan JK, Mittau M. Optimal landing position in reading isolated words and continuous text. Perception and psychophysics, 47 : 583-600, 1990. Zeki S. Les images visuelles. Pour la science, 181 : 60-68, 1992.